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Dr. Heinz Karger + 


Am 27. Marz dieses Jahres ist der Verleger dieser Zeitschrift, 
Dr. Heinz Karger, im Alter von 63 Jahren in Locarno, wo er zur Kur 
war, an einem Herzinfarkt gestorben. Drei Wochen vorher habe ich 
noch einmal die Freude gehabt, ihn in seinem schonen Basler Ge- 
schaftshaus zu sprechen und in seiner Hauslichkeit sein Gast zu sein. 


zweite Jahrgang war im Sommer 1958 abgeschlossen, so daB im 
Herbst 1958 bereits mit dem 3. Jahrgang begonnen werden konnte 
und nun schon die ersten Hefte des vierten Bandes herauskommen. 

Es wird nicht leicht ein Herausgeber von seinem Verleger sagen 
k6nnen, wie ich es kann und wie ich es muB, daB die Zusammen- 
arbeit mit ihm vom ersten Brief an bis zum letzten Besuch eine 
einzige Freude gewesen ist. «Ich kann eigentlich wieder zu allem, 
was Sie schreiben, ohne weiteres ja sagen», schrieb er mir am 
10. Juli 1936 — ein Satz, der sich von beiden Seiten bis in dieses 
Jahr immer wiederholt hat. Wahrscheinlich existierte die Zeitschrift 
nicht ohne die Aufgeschlossenheit, die Tatkraft und die VerlaBlich- 
keit von Dr. Karger; sicher existierte sie nicht im jetzigen Gewand 
ohne die Grofziigigkeit dieses Verlegers, der sich um die Phonetik . 
ein Verdienst erworben hat, fiir das ihm nach seinem zu friihen 
Tod noch einmal Dank zu sagen meine letzte Pflicht ist. 


Eberhard Zwirner 


Kahane, H. and Kahane, R.: Phonetica 4: 61-70 (1959). 


From the University of Illinois, Urbana, Ill., USA 


The Variants of a Respondeme Described in Terms 
of Taxemes 


By Henry AND RENEE KAHANE 


A stimulus may produce various responses, verbalized or non- 
verbalized, which in turn become stimuli, verbalized or non- 
verbalized, producing a new response. A familiar situation may 
serve as illustration*. In an Athenian bus, immediately after the 
discharge or entrance of passengers, the conductor must signal to 
the driver for the automatic closing of the door and the resumption 
of the trip. The readiness of the bus, then, is the first stimulus; the 
signal to the driver, the response. This response may be verbalized 
or non-verbalized. Non-verbalized responses are whistling, the 
ringing of an electric bell, or the raising of an arm. Verbalized 
responses are various patterns of calls. All these responses, ringing 
and arm-lifting and whistling and calling, become stimuli for the 
new response: the driver sets the bus in motion. The situation can 
be schematized in the following diagram (in which r or R stands 
for response, s or § for stimulus, and v for verbalized; a lower-case 
letter is used for the event under discussion, and capitals for the 
stimulus leading to or the response resulting from, the event under 
discussion) : 


* The present essay is part of a study of the verbal categories, which was carried on 
in Greece, 1955-56, and supported by the John Simon Guggenheim Memorial Founda- 
tion. Various aspects were discussed with our friends, Angelina Pietrangeli (University of 
Illinois), Sol Saporta (Indiana University), Francine Frank (Geneva), and Hansjakob Seiler 
(University of Hamburg). 


62 H. and R. Kahane, The Variants of a Respondeme Described 


ress; 


[ringing] 


S Si = = 
[readiness to move] [whistling } [moving] 


VI3 CO VS3 


[calling] 


The events 7, and r, and vr, (or the identical s, and s, and vss) 
are, then, variant expressions of a unit of response (or, for that 
matter, stimulus) with the structural meaning ‘link between S$ 
and R’. This unit of response may be called a respondeme; the 
variants, correspondingly, as different forms of the same unit, are 
labeled alloresponds. It should be stressed that the alloresponds 
through which a certain respondeme is realized are variants for 
that particular respondeme alone. The alloresponds of interest in 
this particular context are those that are verbalized; and the 
problem that arises is how to describe their differences. 

Here, again, we shall try to follow the analogy of the usual 
analysis; just as allomorphs are described in terms of phonemes, 
and allotaxes in terms of morphemes, so, on the level of responds, 
the allo-entities (or variants) of the higher level may be described 
in terms of the -eme units (or oppositions) of the lower level. In 
other words, the various alloresponds of a respondeme are here 
described in terms of their constituent taxemes. The taxeme (or 
function class) is defined as the relation of a particular constituent 
of a respondeme to the whole respondeme, with that relationship 
expressed through its reflex in the inflectional verbal morphemes, 
or, in non-verbal expressions, through equivalents of this reflex. 

The verbal taxemes, analyzed in detail elsewhere (Henry and 
Renée Kahane, “The System of the Verb in the Western Languages’’, 
Syntactica und Stilistica: Festschrift fiir Ernst Gamillscheg 261-275 [Ti- 
bingen, 1957]), constitute the two component axes found in varying 
plus and minus relationships within the four frames of tense, mood, 
agreement, and voice. They are, therefore, eight in number: aspect 
and tense (within Tense), utterance pattern and value (within 
Mood), person or gender and number (within Agreement), modi- 
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fication and diathesis (within Voice). Each taxeme has either a 
marked (plus) or non-marked (minus) form. The allorespond, 
therefore, is a bundle of the plus or minus values of eight taxemes. 

a) In the frame of tense (with tense here defined broadly as the 
reflex in the verb of a time particle, such as the adverb), the two 
taxemes, as stated above, are aspect and tense, and each appears in 
a marked or non-marked form. Aspect non-marked is expressed by 
the form present. Aspect marked, in the material observed, is 
marked for punctuality and is expressed by the form aorist. The 
taxeme tense (with tense used in the narrow sense), when non- 
marked, is expressed by the present. Tense marked is expressed by 
either past or future, although in the material observed only the 
past appears. (While past and future are in morphemic contrast, 
they cannot be in taxemic contrast. On the taxemic level, both 
share the meaning ‘marked for reflex of the adverb’ and contrast 
only with ‘non-marked for reflex of the adverb’. Plus, in other 
terms, does not contrast with plus but only with minus. Conse- 
quently, past and future must be considered as two different 
realizations of the plus form of the taxeme tense, that is, as allotaxes 
or non-contrasting variants. The allotaxes past and future are 
expressed by certain morpheme sequences, past by a sequence 
containing, explicitly or implicitly, the prefix augment, future by 
one containing the prefix tha.) 

b) In the frame of mood (1.e., the reflex in the verb of a modal 
particle, such as a conjunction), one taxeme is marked or non- 
marked for utterance pattern. The plus form is marked for volun- 
tative (or non-reality?). Non-marked is expressed by the form tra- 
ditionally called indicative. The voluntative is expressed by the 
form imperative, or by the zero form of some such verb as thélo 
‘I want’ followed by the element na plus another verb form, or by 
a form with the prefix tha. The second taxeme is marked or non- 
marked for value. The plus form is marked for either negativity or 
potentiality. Non-marked is expressed by the so-called affirmative 
form of the verb. All verbal forms observed in the present context 
are non-marked for value. 

c) In the frame of agreement (1.e., the reflex in the verb of the 
actor), one taxeme is marked or non-marked for person. The plus 
form is marked for either first or second person. These two marked 
patterns are, again, analyzed as allotaxes, that is, two different 
non-contrasting realizations of the same plus form of the taxeme. 
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The non-marked form is expressed by the third person. The second 
taxeme is marked or non-marked for number. The plus form is 
marked for plural. Non-marked is expressed by the singular. 

d) In the frame of voice (i.e., the reflex in the verb of the verb 
modifiers such as the object and predicative), one taxeme is marked 
or non-marked for modification, i.e., the pattern of the modifier. 
The plus form is marked for transitive or copulative. Both patterns 
are allotaxes of the same plus form of the taxeme. Non-marked is 
expressed by the intransitive. All verbal forms observed in the 
present context are non-marked for modification. The second 
taxeme is marked or non-marked for diathesis. The plus form is 
marked for the medio-passive. Non-marked is expressed by the 
active. All verbal forms observed in the present context are non- 
marked for diathesis. 

So far, the system analyzed is that of the verbal expressions, the 
verb being defined as that element of an expression (or allorespond) 
that carries, mostly in the form of a cluster of inflectional endings, 
the (overt or covert) morphemes reflecting the other elements of 
the allorespond (i.e., actor, object-predicative, temporal particles, 
and modal particles). Now, in the material under discussion, there 
are also examples of non-verbal (grosso modo, nominal) expres- 
sions; these can be defined as alloresponds lacking the redundant 
and organizing element of the verbal endings. In these non-verbal 
alloresponds, the same taxemes appear as in the verbal expressions ; 
but non-verbal criteria have to be applied in determining them. 
So far as the present material is concerned (but, of course, not 
necessarily for the language), the non-verbal patterns show non- 
marked forms of the taxemes of aspect and tense (in tense), of value 
(in mood), and of diathesis (in voice). 

The other taxemes may be either marked or non-marked. Thus, 
in regard to the axis of utterance pattern, within the frame of mood, 
a non-verbal nexus is marked for voluntative when it contains a 
vocative as the (expressed or implied) actor. A vocative is established 
as actor by elimination, i.e., by the fact that no other (expressed or 
implied) constituent in the same non-verbal nexus can function as 
actor. For example, in ¢kso-ydni ‘outside, John’ the implied actor 
might be, say, to-skilt ‘the dog’ and therefore ydni ‘John’ cannot be 
the actor; the taxeme of utterance pattern, in this case, is in the 
minus form, i.e., non-marked for voluntative. On the other hand, 
in ékso-ydni ‘out, John!’, neither to-skili ‘the dog’ nor any other 
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element having the same distribution can be the actor, but only 
the vocative ydni ‘John’; therefore, the taxeme is in the plus form, 
i.e., marked for voluntative. Presence in the non-verbal allorespond 
of the function class predicative serves as a criterion showing that 
the vocative form does not function as the taxeme actor (e.g., 
étimi-ydni “we are ready [literally, ready (masc. plur.)], John’, where 
the morpheme plural étmi implies the actor emis ‘we’). On the other 
hand, the vocative is frequently found as actor in the environment 
of an element fulfilling the criteria of an object, such as, in Modern 
Greek, the accusative (e.g., in ton-gafé-mu-ydni ‘my coffee, John!’, the 
accusative ton-gafé-mu functions as object, the vocative ydni as actor, 
and thus, the taxeme of utterance pattern is marked for voluntative). 

In the frame of voice, the non-verbal patterns may be marked 
or non-marked for modification. The non-verbal nexus is marked 
for modification when it contains an element fulfilling the criteria 
of an object, such as non-agreement with the actor or, in Modern 
Greek, the accusative case. This is a pattern corresponding to 
transitiveness in the verbal taxeme. Or it is marked for modification 
when it contains an element fulfilling the criteria of a predicative, 
such as agreement with the actor; this is a pattern corresponding to 
copulativeness in the verbal taxeme. Object and predicative are 
allotaxes of the plus form of the same taxeme. Non-marked for 
modification is expressed by the absence of what would correspond 
in a verbal allorespond to either object or predicative; this is a 
pattern corresponding to intransitiveness in the verbal taxeme. This 
pattern may be expressed by interjective elements not accompanied 
by either object or predicative (e.g., ¢kso ‘out!’). 

In the frame of agreement, a special situation obtains. Usually, 
the two axes of all frames are identical for the verbal and the non- 
verbal alloresponds. In agreement, however, while the axis of 
number remains the same for both, the second axis, which is person 
for the verbal alloresponds, is at times person and at times number 
for the non-verbal alloresponds. It is person for those non-verbal 
alloresponds that do not contain the predicative, but number for 
those that do. Three observations should therefore be stated: a) The 
taxeme number (found in all non-verbal expressions) may be marked 
or non-marked. The plus form is marked for plural. Non-marked 
is expressed by the singular. b) The taxeme gender, found in non- 
verbal patterns containing a predicative, may be marked or non- 
marked. The plus form is marked for either masculine or feminine, 
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since both are different realizations of the plus form of the same 
taxeme. Non-marked is expressed by the neuter, since it is the 
pattern used potentially in Greek (in the plural) with non-noun 
reference. c) The taxeme person found in non-verbal patterns not 
containing the predicative (i.e., containing instead, in the material 
observed, an interjection or an object) may be marked or non- 
marked. The plus form is marked for second person. The criterion 
in this case is distribution. The marked pattern is that one in which 
the vocative (explicit or implicit) is required; the non-marked is 
the one in which it is not. To illustrate: a pattern such as nd-o-késtas 
‘here comes Kostas’, consisting of interjection + nominative (i.e., 
non-vocative), is interpreted as non-marked for person; while 
brés-késta ‘come on, Kostas!’, consisting of interjection + vocative, 
is considered as marked for second person. The same situation 
obtains in non-verbal expressions containing the function class 
object. For example, ton-gafé-ydni ‘the coffee, John!’, consisting of 
object + vocative, is marked for second person, but ton-gafé-tu-o- 
ydnis ‘John (is as usual drinking) his coffee’, consisting of object + 
nominative (i.e., non-vocative), is non-marked for person. 

On the basis of this system, then, each of the alloresponds of 
the respondeme ‘start moving’ may be defined in terms of its eight 
taxemic constituents. The symbolization used is the following: 
+ = marked, —- = non-marked (with the two meanings, in Jakob- 
son’s phrasing, statement of non-A and no statement of A); the 
capital letters refer to the four frames: T = tense, M = mood, 
A = agreement, V = voice; the lower case letters refer to the axes 
(or taxemes) of each frame, with T (tense) having the axes a = 
aspect and t = tense, M (mood) having the axes u = utterance 
pattern and v = value, A (agreement) having the axes n = number 
and p = person or g = gender (the latter for predicative patterns 
of non-verbal expressions), and V (voice) having the axes m = mod- 
ification and d = diathesis. In the case of plus symbols the pattern 
for which each taxeme is marked is added in parentheses; marked 
patterns are, for a, punctuality; for t, past and future; for u, volun- 
tative; for p, first person and second person, and for g, masculine and 
feminine; for n, plural; for m, object and predicative. All examples 
are listed in phonemic transcription; two digraphs are used: th for 
the voiceless dental fricative, gh for the voiced velar fricative. 

1. fiye ‘go. Verbal. T: +a (punctuality), -t; M: +u (volun- 
tative), -v; A: +p (second), —n; V: —m, -d. The equivalent but 
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more explicit example /fiye-téra ‘go now!’ contains the temporal 
particle téra ‘right now’: the aorist stem of the verb reflects its 
taxemic meaning ‘marked for punctuality’ (only one, to be sure, of 
the various allosemes or contextually determined meaning variants 
of téra); and the imperative form of the inflectional morpheme, 
always non-marked for tense, reflects the taxemic meaning of t¢éra, 
whether that meaning is ‘non-marked for tense’ or ‘marked for 
future’, since minus always has the double value, statement of non-A 
or no statement of A. Again, the equivalent but more explicit 
example fiye-vasili ‘go, Basil!’ contains, as actor, the vocative vasili 
‘Basil!’, whose taxemic meaning ‘marked for second person’ is 
reflected in the imperative form of the inflectional morpheme, and 
whose taxemic meaning ‘non-marked for number’ is reflected in the 
singular form of the inflectional morpheme. 

2. na-fiyis ‘you should go’. Verbal. T: +a (punctuality), -t; 
M: +u (voluntative), -v; A: +p (second), —n; V: —m, —d. 

3. tha-fiyis ‘you shall go’. Verbal. T: +a (punctuality), -t; 
M: +u (voluntative), -v; A: +p (second), -n; V: —m, -d. In 
principle, the morpheme tha admits of two interpretations, de- 
pending on the frame of reference. In certain environments, the 
expression tha-fiyis must be considered as marked for tense (future) 
and non-marked for utterance pattern. In the environment of modal 
oppositions, however, it can be considered as marked for utterance 
pattern (voluntative) and, therefore, non-marked for tense. The 
latter is the analysis accepted here, since, in the present context, 
the first person form corresponding to tha-fiyis would be as-figho 
‘let me go’ rather than tha-figho ‘I will go’. 

4. éfigha ‘I left’. Verbal. T: +a (punctuality), +t (past); M:—u, 
-v; A: +p (first), -n; V: —m, -d. In the frame of tense, éfigha is 
structurally past, although, on the level of parole, it is non-marked 
for tense, and marked solely for punctuality (‘I’m on the point of 
leaving’). 

5. efighame ‘we left’. Verbal. T: +a (punctuality), +t (past); 
M: -u, -v; A: +p (first), +n (plural); V: —m, -d. Like éfigha 
above, efighame, on the level of parole, is non-marked for tense, and 
marked solely for aspect (‘we’re on the point of leaving’). 

6. pdme ‘let’s go’, with the allomorph pdmete containing the 
imperative marker —te. Verbal. T: +a (punctuality), -t; M: +u 
(voluntative), -v; A: +p (first), +n (plural); V: —m, -d. On the 
level of parole, pdme is inclusive, i.e., marked for both first and second 
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persons. The equivalent but more explicit example pdme-mitso ‘let’s 
go, Metsos!’ contains as co-actor, together with eghé ‘I’, the vocative 
mitso ‘Metsos!’, whose taxemic meaning ‘marked for second person’ 
is co-reflected in the imperative form of the inflectional morpheme, 
and whose taxemic meaning ‘co-actor’, together with the meaning 
‘co-actor’ of the implied other actor eghé ‘1’, is reflected in the plural 
morpheme of the verb form. 

7. piyene ‘get going’. Verbal. T: —a, -t; M: +u (voluntative), 
-v; A: +p (second), —n; V: —m, —d. The present imperative piyene 
replaces the (non-existent) aorist imperative *fde; in other words, 
the pattern non-marked for aspect includes the meaning ‘marked 
for punctuality’, since minus as no statement of plus can mean plus. 

8. éla ‘come on!’. Verbal. T: +a (punctuality), -t; M: +u 
(voluntative), -v; A: +p (second), —n; V: —m, —d. The aspectual 
analysis is based on the contrast between {el} and {erx} ‘come’, in 
which the former is marked for punctuality and the latter non- 
marked for aspect. The equivalent but more explicit example éla- 
mitso ‘come, Metsos!’ contains, as actor, the vocative mitso ‘Metsos!’, 
whose taxemic meaning ‘marked for second person’ is reflected in 
the imperative form of the inflectional morpheme, and whose 
taxemic meaning ‘non-marked for number’ is reflected in the 
singular form of the inflectional morpheme. 

9. klise ‘close!’. Verbal. T: +a (punctuality), -t; M: +u (vol- 
untative), -v; A: +p (second), -n; V: —m, -d. An alternative 
solution is to consider klise as klise plus potential object, therefore as 
an allotax of klise-tim-bérta ‘close the door!’; in this case, klise would 
have to be analyzed as having the taxemic constituent +m (transitive) 
instead of —m (non-marked for modification, i.e., intransitive). 

10. dde ‘get going!’. Verbal. T: —a, -t; M: +u (voluntative), 
-v; A: +p (second), -n; V: —m, —-d. An alternative solution would 
be to analyze dde as non-verbal with, however, the same taxemic 


constituents. The verbal interpretation suggested here (which is. 


independent, of course, of historical considerations) is based on the 
apparent identity of the final element —e of this expression with the 
typical imperative morpheme {-e} although, to be sure, ad- occurs 
in no other distribution. ‘ 

11. éys ‘giddap!’. Non-verbal. T: —a, -t; M: +u (voluntative), 
-v; A: +p (second), —n; V: —m, -d. 

12. brés ‘on your way!’. Non-verbal. T:—a, -t; M: +u (volun- 
tative), -v; A: +p (second), —n; V: —m, —d. 
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13. porta ‘door!’. Non-verbal. T: —a, -t; M: +u (voluntative), 
-v; A: +p (second), —n; V: +m (object), —d. The taxemic analysis 
of the non-verbal expression pérta as an object hinges on its inter- 
pretation, in morphemic terms, as an accusative; and it is assumed 
to be an accusative because in non-verbal expressions the articulated 
accusative (##m-bérta) may appear in a non-articulated variant (péria), 
whereas the articulated nominative (i-péria) would probably not. 

14. étimos ‘ready (masc. sing.)’. Non-verbal. T: —a, -t; M: —u, 
-v; A: +g (masculine), -n; V: +m (predicative), —d. 

15. étimi ‘ready (masc. plur.)’. Non-verbal. T: —a, -t; M: -u, 
-v; A: +g (masculine), +n (plural); V: +m (predicative), —d. 

16. étima ‘ready (neut. plur.)’. Non-verbal. T: —a, -t; M: -u, 
-v; A: -g, +n (plural); V: +m (predicative), -d. The neuter in 
this case seems to have a non-noun referent, such as, say, dla ‘all 
(neut. plur.)’. 

17. plires ‘full (neut. sing.)’. Non-verbal. T: —a, -t; M: —-u, -v; 
A: -g, -n; V: +m (predicative), —d. 

These seventeen patterns represent eleven alloresponds. The 
following table, in which, it should be remembered, two different 
marked realizations of the same taxeme are considered as taxemic- 
ally equivalent (i.e., as allotaxes) and in which the taxeme person 
(p) corresponds in predicative patterns to the taxeme gender (g), 
gives a résumé of the eight taxemic constituents of the alloresponds. 

To complete the analysis of the respondeme under discussion, 
three cases should be noted of sequences of two different alloresponds 
(i.e., two distinct patterns of taxeme combinations) that were 
observed. 

a) brés-fiye ‘on your way !’. The non-verbal taxeme brds (12 above) 
differs from the verbal taxeme ftye (1 above) in only one respect: brés 
is non-marked for aspect, whereas fiye is marked for punctuality. 

b) éla-pdme ‘come on, let’s go!’. The verbal taxeme éla (8 above) 
differs from the verbal taxeme pdme (6 above) in only one respect: 
éla is non-marked for number, whereas pdme is marked for plural. 
(The difference between marked for second person, as represented 
by éla, and marked for first person, as represented by pdme, is not 
counted, since both are analyzed as allotaxes: i.e., as two different 
realizations of the same taxeme, ‘marked for person’.) 

c) porta-fiye ‘door, go!’. The non-verbal taxeme pérta (13 above) 
differs from the verbal taxeme fiye (1 above) in two respects: péria 
is non-marked for aspect (numerous instances of objects in non- 
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cil M A Vv 

a t u v p/g n m d 

I Sve, na-fiis, 
tha-fiyis, éla, klise + - =f oh a “4 = bs 
Ss I éfghs + + - = Kae ny 
8 Ill = efighame + + = = oh =f - - 
IV pdame = 2B ti = ES a is i 
Vv piyene, dde - = ae = a 7 es a 
VI éys, bros - - + - ate = es a 
‘s VII ~spérta _ = at = us a 78 ~ 
5 VIII étimos - = = = ie = a ns 
‘ IX _ plires - = = = = “4 + 5 
2 x étimi - — = = =e as A A 


XI étima = = = = 


verbal expressions imply, to be sure, the aspect of punctuality, yet 
not all) whereas fiye is marked for punctuality; and pérta is marked 
for object whereas fiye is non-marked for modification. 

Finally, by way of résumé, it may be well to restate once more 
the three problems briefly discussed on the basis of an observed 
situation: 1. the relation between responses and response variants; 
2. the method of describing the differences between response var- 
iants; 3. the identical analysis of verbal and non-verbal expressions. 


Summary 


Three problems are briefly discussed on the basis of an observed 
situation: 1. the relation between responses and response variants; 
2. the method of describing the difference between response variants; 
3. the identical analysis of verbal and non-verbal expressions. 


Kusammenfassung 


Drei Fragen werden auf Grund einer beobachteten Situation kurz erlautert: 
1. die der Beziehung zwischen sprachlicher Reaktion und den Varianten dieser Reaktion; 
2. die der Methode, Unterschiede in Reaktionsvarianten zu beschreiben; 3. die der 
gleichen Analyse fiir verbale und nichtverbale Ausdriicke. 


Résumé 
Exposé de trois problémes A partir d’une situation donnée: 1° la relation entre la 


réponse et les variantes de cette réponse; 2° la méthode de description des différences 


entre les variantes d’une réponse; 3° l’analyse identique d’une expression verbale et 
non-verbale. 
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0. In an earlier article! in this same journal on the problem of 
the interpretation of pitch and stress in Northern Tepehuan? it was 
suggested that an instrumental analysis of a few apparent contrasts 
’ of pitch or stress might serve to give direction to an analyst who is 
undecided as to the exact nature of these contrasts. 

At the University of Oklahoma in the summer of 1956 taped 
material on Northern Tepehuan gathered by the author was on 
hand and seemed to indicate either a contrastive pitch-stress com- 
ponent or possibly a pitch component apart from stress. The decision 
was made to try an instrumental analysis. The analysis was done 
by Barrett of the University of Michigan, and was included in the 
above mentioned article. The report of this analysis made it im- 
perative that the phonemic pitch hypothesis be taken seriously and 
thus the report on the collaboration was made available through 
the article already referred to. 

The present paper is written to make available the results of 
following up the pitch hypothesis with many hours of informant 
work and of concentrated auditory analysis over a period of several 
months. During the last two and a half months of this period these 
studies were conducted under optimum conditions, with an in- 
formant, and with access to linguistic consultation®, It was in this 
way that the phonemic pitch hypothesis suggested by the instru- 
mental analysis was confirmed under auditory conditions. 

This conclusion is now strongly supported by items showing 
contrasts in lexical pitch beyond those available to us in the earlier 
article. Further support developed by way of the system of tonal 
morphophonemic changes which reflect an elaborate, highly regular 
patterning of tone relationships in the language. This pattern did 
not emerge into view until the proposed pitch hypothesis was 
applied. From the tonomechanical system formulas of high-level 
generality can be abstracted which are applicable to a text as a 
whole for describing and predicting tonomechanical changes in it. 

1 Pike, Kenneth L.; Barrett, Ralph P. and Bascom, Burt: Instrumental Collaboration on 
a Tepehuan (Uto-Aztecan) pitch problem. Phonetica 3: 1-22 (1958). 

* Northern Tepehuan is a Uto-Aztecan language of the Pima-Papago branch. The 
author has studied the language with several informants. The one whose dialect is 
represented in this paper is Hermenejildo Carrillo, a nineteen-year-old boy, whose 
home is in Baborigame, Chihuahua, Mexico. 

The segmental phonemes in this dialect are: p, t, tY, k; b, d, dY, g; v, s, 8, x, &} 
m,n, 15 Lr, RS Wy ¥§ ie) any Ur AG 


* The author wishes to express appreciation to Dr. K. L. Pike for his many helpful 
suggestions and for direction during the writing of this article. 
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1. Northern Tepehuan has two phonemic tones: high tone, 
symbolized by /V/; and low tone, represented by /v/. High tone 
has two allotones: a higher-toned allotone which occurs only follow- 
ing another high tone in the same long syllable*; and a lower-toned 
allotone which occurs under other conditions where that phonemic 
tone may be found. Low tone has two principle allotones: a lower- 
toned allotone which occurs only at the end of a rhythm group5; 
and a higher-toned allotone which varies from slightly above the 
lower allotone of low to slightly below the lower allotone of high. 
Between the higher variant of low following high tone and its lower 
allotone at the end of a rhythm group a sequence of low tones may 
have intermediate allotones stepping down gradually in pitch from 
the first to the second. Also on a series of phonemically low syllables 
preceding high tone there may be a gradual stepping up of the 
pitch from the lower to the higher of the allotones. 

The following are examples of pitch contrasts (note especially 
the added members which contain the sequence /VV/ which fulfill 
our speculations in the preceding paper); acute accent over a vowel 
indicates high tone, analogous to V of the formulas: 

kasi8 kéi ‘Did he already kill them?’ 

kasi8 koi ‘Did he already go to sleep?’ 

gosiar kdi ‘Is that a snake?’ 

kasi8 iia ‘Did he already shout?’ 

kasi§ ifia ‘Did he already cover it?’ 


aii ‘Catch up to him!’ 
aifii ‘It is broken.’ 

Aisi ‘Did he arrive?’ 
aisi ‘Did it break?’ 


kasi8 yaa ‘Did they already roll?’ 
kasiS yaa ‘Did he already roll?’ 


In words in which no vowel clusters are present, stress always 
seems to occur on the high pitched syllable. In some words con- 
taining vowel clusters, however, we hear considerable fluctuation 
of stress. Note the following examples: 


4 A long syllable contains two vowels; a short syllable contains one vowel. 

5 A simple rhythm group is a unit of timing with one peak of high pitch. The 
timing phenomena groups the syllables around the high-pitched peak.The rhythm group 
is set off by phonological junctures such as pause, pitch, or break in rhythm. 
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[’kasis ’voi]® or [’ka8i8 voi] or [’ka8i8 ’vo'i 

‘He already lay down’ in which the pitch is constant while the 
stress fluctuates. This same phenomenon is observed in the following 
examples: 

[’ooxdédai] or [oo’xddai] or [’00’xddai] ‘He tires’. 
[giisatai] or [gu’Satai] _or [’gii’Satai] ‘He is frying’. 
[’vaathkana] or [vAa’thkana] or [’vaa’thkana] 

“They are lying down’. 

This type of fluctuating stress occurs on all words with a long 
low-pitched initial syllable followed by a short high-pitched second 
syllable. Since no examples of lexically contrastive stress have been 
observed, and since stress is freely fluctuating in many words, as 
seen in the above examples, it is interpreted as being lexically 
non-phonemic and will be symbolized only indirectly by the spacing 
and tone marks from which it can be predicted. 

2. The phonological unit which serves most adequately as a 
basic unit of tone placement in relation to which all tonal morpho- 
phonemics’ of Northern Tepehuan can be described is a vowel 
sequence of two vowels either diverse or like. This two vowel 
clusteral unit occurs on stems, which when suffixed, show certain 
regular tone perturbations. A choice of a three vowel cluster as the 
basic unit would require a much more complex statement of tone 
perturbations, while a choice of a single vowel as the basic unit 
would prove inadequate to describe all of the tone perturbations 
which have been observed. A three vowel cluster functions as a 
two-syllable sequence of a single vowel plus a cluster of two vowels. 
Thus there is no need to postulate a more complex primitive unit. 


2.1. The four basic tone-sequence classes in the syllable nuclei 
are: Class 1: /VV/; Class 2: /Vv/; Class 3: /vV/; and Class 4: /vv/. 


® An apostrophe preceding a vowel or a consonant-vowel indicates stress. 

Since the writing of this article, evidence for fluctuating stress has been recorded on 
spectrograms. This fluctuating stress occurs on words with long syllables. Words com- 
posed of one long syllable show fluctuation between stress on the first vowel, stress on 
the second vowel and stress on both vowels. Words composed of two long syllables show 
fluctuation of stress between the first and second syllables as well as fluctuation of stress 
within the syllable. In two of the utterances recorded the stress is about equal on both 
syllables, in another utterance the first syllable is more heavily stressed and in still 
another utterance the second syllable is stronger. In the final syllable there is a sharp 
fade-away of the stress on the second vowel in two of the utterances and there is very 
little or no fade-away in the other two utterances of the same word. 

* This paper ignores any morphophonemic changes of segments which are un- 
related to tonal perturbations. 
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In setting up the basic tone sequences Pike’s criteria of “predic- 
tability in description” and ‘“‘greatest differentiation in tonemic 
combinations” were used 8. 

Morphophonemic tone perturbations are caused by suffixation 
of both verb stems and noun stems. 

The perturbations of the basic Tone-Sequence Classes 1, 2, 
and 3 are caused by the following suffixes on Punctiliar verb stems: 
-na® ‘first person singular’, -8i ‘interrogative’ (and related forms, 
see below), -tyiki ‘emphatic past’ (and related forms), -dta ‘past’ 
(and related forms), -tu ‘causative’, -tuli ‘benefactive’; or by the 
following suffixes on the extensive stem: -3i ‘interrogative’ (and 
related forms), -Ava ‘present emphatic’, -tadai ‘past continuative’ ; 
or by the following suffixes on noun stems -%i ‘interrogative’ (and 
related forms), -kada ‘with’, -Ava ‘assertative’, -aba ‘on’, -Ana “at, 
in’, -Ara ‘in’, -ko ‘next to’. 

The interrogative suffix -8i, the emphatic past suffix -tyiki, and 
the past suffix -4ta represent the following three sets of suffixes 
respectively. (Each of the suffixes in any particular set causes the 
same perturbation pattern on the tone sequence of the stem to 
which it is suffixed. Thus the third person singular of each of these 
sets of suffixes is representative of the particular tone perturbations 
which a given set causes.) 


Interrogative Emphatic Past Past 
Ist per. sing. -nsi -ntyiki -anta 
2nd per. sing. -padsi -patyiki -apata 
3rd per. sing. -Si -tyiki -ata 
Ist per. pl. -tasi -tatyiki -atata 
2nd per. pl. -MASI -matyiki -Amata 
3rd per. pl. -Si -tyiki -ata 


The perturbations of basic Tone-Sequence Class 4 are caused 
by the following suffixes on extensive verb stems: -3i ‘interrogative’ 
(and related forms), -ava ‘assertative’, -tadai ‘past continuative’, 
-mi ‘progressive’, -fi ‘imperative’, -na ‘subjunctive’, -na-pa-sa ‘sub- 
junctive 2nd-person quotative’, -4gi ‘intentive’, -tul-dya-fi ‘bene- 
factive transitive imperative’, -4-pa-8i ‘intentative 2nd-person inter- 
rogative’, -mo ‘future’, -dYi ‘transitive’, -da-fi ‘transitive impera- 
tive’, -da-gi ‘transitive intentive’, -muda ‘past perfective’. 


8 cf. Pike, Kenneth L.: Tone languages. University of Michigan Press, 1948, p. 75. 
® The hyphen here and below indicates morpheme division. 
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We turn from the general circumstances within which the per- 
turbations take place to an analysis of the perturbations themselves. 

2.1.1. There are four principle sub-classes in 'Tone-Sequence 
Class 1 /VV/. These sub-classes (la, 1b, lc, and 1d) are determined 
by their differences in tone perturbations. 

Sub-class la is unperturbed. 

Sub-class 1b is perturbed from a high nucleus to a low nucleus 
preceding a high-toned syllable of an arbitrary set of suffixes and 
by -tu or -tuli. Sub-class 1b,, is perturbed by that set of verb 
suffixes including -4ta and may be represented by the following 
formula: CVV + -ata > Cvv + -dta?°, Sub-class 1b,» is perturbed 
by the verb suffix -4va and may be represented by the following 
formula: CVV + -dva > Cvv + -ava. Sub-class 1b, is perturbed 
by noun suffixes of -VCv shape and may be represented by the 
following formula: CVV + -VCv + Cvv + VCvy. Sub-class Ibs 
is perturbed by the derived high tone(s) of the syllable which it 
precedes and may be represented by the following formula: 
CVV + CV-/CVV- > Cw + CV-/CVV-. 

Sub-class lc is perturbed by each of the sets of verb suffixes 
including -Aata and -tyiki and may be represented by the formula 
for Sub-class 1b,, plus the following formula: CVV + -tyiki > 
CvV + -tyiki. 

Sub-class 1d is perturbed by each of the sets of verb suffixes 
including -ata, -tyiki, and -8i and by the suffix -na and may be 
represented by the formulas for Sub-classes 1b,, and Ic plus the 
following formula: CVV + -8i/-na > CvV + -8i/-na. 

Illustrations of the perturbations of the sub-classes of Class 1 
will be found in the chart of perturbation patterns and in sections 
2 LiD.g Sedes AU Sse ks 

In any potential sequence of three tones on three like vowels, 
there is a reduction of the cluster so that one vowel and one tone 
are lost. For example yaa + -Ata > yaata. It seems convenient to 
treat this change from the point of view of a descriptive order (cf. 
Bloomfield, Language, p. 213, followed by Pike, Tone Languages, 
p. 91). Thus the changes involved when -ata is suffixed to ya4 can be 
described as follows: ‘‘First’’ the tone sequence of the stem is perturbed 


10 The morpheme -dta has four allomorphs: -Ata co -yAta c& -ata co -yata. The 
allomorphs -ata/-yata occur only following high tone. The allomorphs -yata/-yata occur 
only following stems which end in Vi. Any -VCyv suffix has an analogous set of variants. 
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regularly according to Class 3b which would give *yaaata 1". “Then” 
one of the stem vowels is lost, which gives yaata ‘he rolled’. 

The changes involved when -ata is suffixed to ‘yd4a can be 
described as follows: First the tone sequence of the stem is perturbed 
regularly according to Class 2b which would give *yaaata. Next, 
the suffix -ata is perturbed to -ata which would give *yadata. Then 
one of the stem vowels is lost which gives ’ydata “They rolled’. 

2.1.2. There are three principle sub-classes in Tone-Sequence 
Class 2 /Vv/. These sub-classes (2a, 2b, and 2c) are determined by 
their differences in tone perturbation. 

Sub-class 2a, like Sub-class la, is unperturbed. 

Sub-class 2b is perturbed from a high-low sequence to a high- 
high sequence preceding a high-toned syllable of an arbitrary set 
of suffixes or by -tu. Sub-class 2b, is perturbed by that set of verb 
suffixes including -ata and by the verb suffix -tu!* and may be re- 
presented by the following formula: CVv + -ata/-tu > GVV + 
-ata/-tu. Sub-class 2b,» is perturbed by the verb suffix -ava18 and 
may be represented by the following formula: CVv + -ava > 
CVV + -ava. Sub-class 2b., is perturbed by any noun suffix of 
-VCy shape which has a high tone on the first vowel and may be 
represented by the following formula: CVv + -VCv > CVV + 
-vCv "4, Sub-class 2b.» is perturbed by any noun suffix of -V Cv shape 
which has a high tone on the first vowel and by the noun suffix 
-kada and may be represented by the following formula: CVv + 
-vCv/-kada > CVV + -vQv/-kada. Sub-class 2c is perturbed by 
each of the sets of verb suffixes including -ata and -tyiki and’ may be 
represented by the following formula: CVv + -ata/-tyiki > CVV + 
-ata/-tyiki. Illustrations of the perturbations of the sub-classes of 
‘Class 2 will be found in the chart of perturbation patterns and in 
sections 2.2. and 4.1.1. 

2.1.3. There are two principle sub-classes in Tone-Sequence 


11 The asterik indicates a non-occurring form. 

12 Both suffixes -tu and -tuli can be further suffixed by the sets of verb suffixes 
represented by -Si, -tYiki, and -Ata. This produces no further perturbations; thus these 
additional forms were not included in the chart of perturbation patterns. It will be 
noted that there are very few occurrences of these suffixes with the verb stems in the chart. 
This is due either to semantic limitations or to the fact that these suffixes occur on 
alternate forms of the verb stem with different basic patterns and hence different pertur- 
bation results; as for example: ugitYuli ‘He ate it for him’. 

18 cf. footnote 10. 

14 cf. footnote 10. 
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Chart of Perturbation Patterns of Tone Sequence Classes of the Syllable 


In verb stems | 
a a ne a ee ee 


Illustrations of Perturbations of Sub-classes of Class 1 /VV/ 


Basic Sequence -na- “Si -tYiki -Ata -tu -tuli -ava -tadai | 
la  vtidpai* vidpaisi — - - vidpitYuli vudpiava vidpaitYadai** 
[bya kASiS dodi dodina dodiSi dodétYiki doaipydta — - ~ - 

lc kASiS add adinv audSi  auitYiki auudta — - - - 

Id kASiSand? anafna anaiSi anaitYiki anaiyAta — anditYuli = — - 


Illustrations of Perturbations of Sub-classes of Class 2 /Vv/ 


2a kaSiS yda — ydaSi ydatYiki ydata - o - - 
2bya kASi8 di dina ai8i ditYiki atyata aitYu — - - 


2c kASi8 di dina 6iSi ottYiki dtyata - - - - 
Illustrations of Perturbations of Sub-classes of Class 3 /vV/ 


3a kaSiS yad yadna yadSi-yadtYiki -yadta - - - - 
3bya kASi8 sai = saina_~— saiSi_—s saftYiki — satyata_—s sdétYu_—_sdit Yuli - - 


Illustrations of Perturbations of Sub-classes of Class 4 /vv/ 


Si ~Ava -tadai -mi -ni -na -napasa 
4a vudpai vudpaiSi vidpiava vidpaitYadai vidpaimi vidpahi vidpana vidpanapasa** 
4b, Asati Asdi8i asiava asditYadai asdimi Asdnil Asdna asdnapasa 
4c AAxat AaxaiSi Adxaava AdxaitYadai Adxaimi — - - 


In noun stems 


-Si -kada -Ava -aba -Ana ~ATA -Amu -ko 
Ib, tudi tudiSi tudikada tuaiyAva tuaiyA4ba_ tuaiyana  tuaiysra tuaiyamu  — 
2bea tui tuiSi tuikada tutyava tutyaba tutyana tutyara - - 
3bg_ tat taiSi tatkada taiyava taiyaba taiyana tatyAra - taiko 
4b, dnai ondiSi ondikada  ontava ontaba oniéna ondra - a 


* Italics indicate the portion under study. 
** For further examples of la see Class 4 and Section 2.1.4. 


Class 3 /vV/. These sub-classes (3a and 3b) are determined by 
their differences in tone perturbations. 

Sub-class 3a, like Sub-classes 1a and 2a, is unperturbed. 

Sub-class 3b, like Sub-class 1b, perturbs to low tone before 
high tone, and to high tone before -tu and -tuli. Sub-class 3b,, is 
perturbed by that set of verb suffixes including -Ata or by -tu or 
-tuli and may be represented by the following formulas: CvV + 
-Ata > Cvv + -dta and CvV + -tu/-tuli > CVV + -tu/tuli. Sub- 
class 3b,» is perturbed by the verb suffix -Ava and may be represent- 
ed by the following formula: CvV + -dva > Cvv + -A4va. Sub- 
class 3b, is perturbed by any noun suffix of a -VCv shape which 
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has a high tone on the first vowel and may be represented by the 
following formula: CvV + -VCv > Cvv +-VCv. Sub-class 3b, is 
perturbed by the derived tone(s) of the syllable which it precedes 
and may be represented by the following formula: CvV + CV-/ 
CVV- > Cw + CV-/CVV-. Illustrations of the perturbations of 
the sub-classes of Class 3 will be found in the chart of perturbation 
patterns and in Sections 2.2. and 4.1.1. 

2.1.4. There are three principle sub-classes in Tone-Sequence 
Class 4 /vv/. These sub-classes (4a, 4b, and 4c) are determined by 
their differences in tone perturbations. 

Sub-class 4a, like Sub-classes la, 2a, and 3a, is unperturbed. 

Sub-class 4b, is perturbed by any verb suffix and may be re- 
presented by the following formula: ..Cvv'> + any verb suffix > 
..CVV + any verb suffix. Sub-class 4b, is perturbed by any noun 
suffix and may be represented by the following formula: ..Cvv + 
any noun suffix >..CQVV + any noun suffix. 

Sub-class 4c is perturbed by verb suffixes -Agi and -apasi and 
may be represented by the following formula: ..Cvv + -agi/ 
-Apasi > ..CV + -dgi/-Apasi. Sub-class 4c also is perturbed by the 
suffix -mi when the stem alternate concerned is of a special sub- 
type?®. Illustrations of the perturbations of the sub-classes of Class 4 
will be found below and in the chart of perturbation patterns and 
in Sections 2.2., 2.1.5., and 4.1.1. The chart could be extended to 
include the following additional illustrations of the sub-classes of 
Class 4: vudpagi “He will bring it’; vudpityuldYani ‘Bring it for 
him!’; vuadpapasi ‘Can you bring it?’?; vudpamo ‘He is going to 
bring it’; vuapidyani ‘Bring it to him!’; vudpamuda ‘If he had 
brought it’; vudpajai ‘When he brings it’; a’idgi ‘He will plant it’; 
ASitYuldyani ‘Plant it for him!’; asiapasi ‘Can you plant it?’; aSimo 
‘He is going to plant it’; a’imi ‘He is planting it’; aSidYafi ‘Plant it 
for him!’; aSimuda ‘If he had planted it’; asaxai ‘When he plants 
it’; axidpasi ‘Can you catch up to him?’; aiximi ‘He is catching 
up to him’, 


15 The sequence of two dots indicates a non-structural break in a sequence in which 
the unwritten portion is non-pertinent. 

16 The sub-type concerned is number 2 in the following typical sets of verb stem 
alternates: 


if Be Ke 4, 
viidpai © viapi- © viidpa- © vid; “bring’ 
Asai wash = ash ‘plant’ 


44xai coaaxi co 44xa ow Ai; ‘arrive, catch up to’ 
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2.1.5. The above formulas provide morphophonemic rules for 
tone sequences on vowel clusters but we have not dealt with the 
morphophonemic rules for a single high tone or a single low tone 
on a single vowel?’. 

In certain cases it is convenient to treat a low tone occurring 
on a single vowel as a sub-class of Sub-class 4b /vv/ since this low 
tone is perturbed in a manner analogous to the perturbations of the 
two low tones of Sub-class 4b: that is, the total nucleus changes from 
a single low tone to a single high tone preceding every verb and 
noun suffix just as double low tone changes to double high tone 
preceding every verb and noun suffix. 

In the following example of a single low tone preceding a sufhix 
the low tone is replaced by high tone. The single low toned syllable 
is treated as Sub-class 4b, and is perturbed by any noun or verb 
suffix; the sub-class may be represented by the following formula: 
..Cyv + any noun verb suffix >..CV + any noun verb suffix. Note 
ka in the example: naka ‘ear’ plus -3i ‘interrogative’ becomes 
naaka%i ‘Is it an ear?’. 

Note that in the example in the above paragraph the first 
syllable is perturbed from high tone to low tone preceding the 
derived high tone of the second syllable. Thus it is convenient in 
certain cases to treat a high tone occurring on a single vowel as a 
sub-class of Sub-class 1b since this high tone is perturbed in a 
manner analogous to the perturbation of two high tones of Sub- 
class 1b: that is, the total nucleus changes from a single high tone 
to a single or double low tone preceding a high tone just as double 
high tone changes to double low tone preceding a high tone. The 
segmental morphophonemic change from one to two vowels on 
suffixed stems is arbitrarily and non-predictably determined by the 
lexical item in which the particular vowel occurs. 

The single high-toned syllable is treated as Sub-class 1b,» 
or 1bge. This sub-classification is determined by the change of vowel 
nucleus from one vowel in the basic form to one or two vowels in 
the perturbed form. The syllable under study may be composed 
of either a vowel or a consonant plus a vowel. 

Sub-class 1bgp may occur on a syllable in a verb stem or in a 
noun stem, and may be represented by the following formula: 
V + Cwv- + suffix > *V + CVV- + suffix > v + CVV- + suffix, 


1” There are no tone sequences on a single vowel. 
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as seen in Asai ‘He is planting’ plus -8i ‘interrogative’ which “‘first’’ 
becomes *Asai8i and then becomes asai3i ‘Is he planting?’. Note 


sty 


also kXvai ‘snow’ plus -8i ‘interrogative’ which first becomes *kAvai8i 
and then becomes kavai3i ‘Is it snow?’. 

Sub-class 1bge occurs on a syllable in noun or verb stems and 
may be represented by the following formula: V + Cvv-/Cv- + 
sufix > *V + CVV-/CV- + suffix > vw + CVV-/CV- + suffix. 
Note the example naka ‘ear’ plus -8i ‘interrogative’ which first 
becomes *nakaSi and then becomes naakaii ‘Is it an ear?’. 

2.1.6. Meanings of the forms listed in the chart of perturbation 
patterns of the tone-sequence classes of the syllable: vuapai ‘He 
brings’; vudpaisi “Does he bring?’; vuapityuli ‘He brings it for 
him’; vidpiava ‘He does bring’; vuapaityadai ‘He was bringing’; 
ka3iS doai ‘Did he already get well?’; dodina ‘I got well’; doaiii 
‘Did he get well?’; doaityiki ‘He did get well’; doaiyata ‘He got 
well’; kasi auu “Did he already eat?’; auina ‘I ate’; ati8i ‘Did he 
eat?’; auutyiki ‘He did eat’; auuata ‘He ate’; kAsis andi ‘Did he 
Slbaaaty) sing?’; anaina ‘I sang” anaisi ’Did he sing?’; anaityiki “He 
did sing’; anaiyata “He sang’; anditYuli ‘He sang for him’; kasiS yaa 
‘Did they already roll?’; ydasi ‘Did they roll?’; yaatyiki “They did 
roll’; yaata “They rolled’; kasi§ ai ‘Did he already catch up to 
him?’; aina ‘I caught up to him’; ai3i “Did he catch up to him?’; 
aityiki “He did catch up to him’; aiyata ‘He caught up to him’; 
aityu ‘He caused it to catch up to him’; kasi8 di ‘Did he already 
give it’; dina ‘I gave it’; di8i “Did he give it?’; dityiki ‘He did give 
it’; diyata ‘He gave it’; kasiS yaa ‘Did he alidicky roll?’?; yaana 
‘I rolled’; yaa8i ‘Did he roll?’; yaatyiki ‘He did roll’; yaata ‘He 
rolled’; kAsis sai ‘Did he already get stuck?’; saina 7 got stuck’; 
saisi ‘Did he get stuck?’ ; saityiki ‘He did get stuck’; saiyata “He got 
stuck’; saityu ‘He stuck it together’; saityuli ‘He stuck it together 
for him’; for meanings of vidpai, vudapaiSi, vadpiava, and vudpai- 
tYadai see above; vidpaimi ‘He is bringing’; vudapafi ‘Bring it!’; 
vudpana ‘that he might bring it’; vuapanapasa ‘(He said) that you 
should bring it’; Asai ‘He plants’; asdai3i ‘Does he plant?’; asiava 
‘He does plant’; asaityadai ‘He was planting’; asdimi ‘He is plant- 
ing’ Asani ‘Plant it’; asdna “That he might plant’; asanapasa ‘(He 
said) that you should plant it’; 44xai ‘He catches up to him’; 
AAxaidi ‘Does he catch up to him’ ; 4axaava ‘He does catch up to him’ ; 
AaxaitYadai ‘He was catching up to him’; 4axaimi ‘He is catching 
up to him’; tudi ‘oak tree’; tuai8i ‘Is it an oak tree?’; tudikada 
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‘with the oak tree’; tuaiyava ‘It is an oak tree’; tuaiyaba ‘on the oak 
tree’; tuaiyana ‘at the oaktree’; tuaiyAra ‘in the oak tree’; tuaiyamu 
‘to the oak tree’; tui ‘corn dough’; tui8i ‘Is it corn dough?’ ; tuikada 
‘with the corn dough’; tuiyava ‘It is corn dough’; tuiyaba ‘on the 
corn dough’; tifyana ‘at the corn dough’; tuiyara ‘in the corn 
dough’; tai ‘fire’; tai8i ‘Is it fire?’; taikada ‘with the fire’; taiyava 
‘It is fire’; taiyAba ‘on the fire’; taiyana ‘at the fire’; taiyAra ‘in the 
fire’; taiko ‘at the edge of the fire’; dnai ‘salt’; onai&i ‘Is it salt?’; 
onaikada ‘with salt’; onidva ‘It is salt’; onidba ‘on the salt’; oniana 
‘at the salt’; onAra ‘in the salt’. 

2.2. The above tone-sequence classes with their respective 
sub-classes supply us with data adequate for formulating formulas 
for describing and predicting the various tone forms and perturba- 
tions of each syllable in words spoken in isolation. Note the following 
example with its formula: dAA.kai (1b 3,.4b,)1® ‘He tastes it’, when 
suffixed by -3i ‘interrogative’ becomes daakai8i (1b ,.4b,.-8i). This 
is to be read as follows: The basic form of the initial syllable has 
two high tones and is Class lbsa. The basic form of the second 
syllable has two low tones and is Class 4b,. Class 1b is here unper- 
turbed before 4b when 4b in turn precedes zero. Note the perturba- 
tion of 4b to high-high when it precedes -3i and the perturbation 
of 1b to low-low when it in turn precedes a derived high-high. 


Further examples with formulas: 


i.dyui (4a.ld) ‘He made it’ i.dyuisi ‘Did he make it?’ 
vidi (la.2b,a) ‘He vomits’ vidiyata ‘He vomited’ 
nA.ai (4a.1b,p) ‘He sees’ nAaiyava ‘He does see’ 
a.Ai (4a.2b,p) ‘They planted’ aXiyata ‘They planted’ 
a.tui (4a.3b,p) ‘He grinds’ atuiyava ‘He does grind’ 
dui.du (3b;.4b) ‘It rained‘ duudusi ‘Did it rain?’ 
ya.ta.gai (1bgc.4b.4a) ‘He lies’ yaatagaisi ‘Does he lie?’ 
a.dX.nai (4a.1b.4b) ‘He smokes’ adaandi8i ‘Does he smoke?’ 
-médo (2bsp) ‘Head’ mdokada ‘With his head’ 


3. Syntactophonemic perturbations are of three types: Type A, 
Type B, and Type C. 

3.1. In Type A, a low tone in normal speech is optionally 
raised to high tone when it occurs between two high tones, as seen 


18 The period within a word or a formula indicates a syllable division. 
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in m4 sddbidYa todsi ‘There he-spied-on the-rabbit’. Compare the 
isolated form soobidYa in which the syllable soo occurs with a low- 
low tone sequence. 

In rapid speech two low tones on adjacent short syllables, one 
of which occurs on the end of a word in a sequence, and the other 
on the beginning of the following word, are optionally raised to 
high tones when occurring between two high tones. Note the 
example avogian masi katX kurarai ‘Scarcely seen as-it-lies the- 
fence’. Compare the isolated forms kaata ‘It lies’ and kurarai ‘fence’ 
in which the syllables ta and ku occur with low tone. 

In slow speech, or in more careful enunciation, as for example 
for emphasis, a low tone at word borders between two high tones 
is not raised: gaamo koi ‘downstream’. The syllable mo retains its 
lexical low tone even though it occurs between two syllables with 
high tones. 

3.2. In Type B a basic Tone-Sequence Class 3b /vV/ on a 
cluster of two like vowels at a word border is modified by the loss 
of the first vowel of the cluster and the tone which accompanies it. 
This perturbation is found in rapid speech when the perturbed 
syllable occurs between two syllables each of which has a high tone as 
seen in: Avégian masi katX kurarai ‘Scarcely seen as-it-lies the- 
fence’. Compare the isolated form kaata ‘It lies’. Note also the 
illustration of Type A in ma%i by comparing the isolated form magi 
‘It is visible’. 

3.3. In Type C, a word composed of two syllables with Tone- 
Sequence Classes 1b.4b is perturbed in the same manner as when 
suffixed. This perturbation occurs before a word in which the first 
syllable is long and low-pitched and the second syllable is short and 
high-pitched as seen in: kuumui tai86li mansana ‘Is-eating pig 
apple’. Compare the isolated form kuumui ‘He is eating’; see also 
Sections 2.1.1. and 2.1.4. for perturbation patterns of Tone-Sequence 
Classes 1b and 4b. 

4, In the accompanying text (see below) the number and small 
letter combinations following the words refer to the tone-sequence 
perturbation classes of the syllables as described in Section 2.1. 
The capital letters A, B, and C refer to syntactophonemic pertur- 
bation types as described in Section 3. The capital letter U refers 
to perturbable syllables which in this text occur unperturbed. Only 
those tone sequences which are perturbable are labeled. Any un- 
labeled syllable in the text is unperturbable and hence belongs to 
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one of the four Tone-Sequence Sub-Classes la, 2a, 3a, or 4a (cf. 
Sec. 2.1.). For example the first word in the text, if labeled, would 
have appeared as aidaSi (la.4a.4a.). 

4.1. Examples of the morphophonemic perturbation classes 
found in the text are listed below. Listed first (in Sec. 4.1.1.) are 
those which occur perturbed in the text. Listed next (in Sec. 4.1.2.) 
are those which occur unperturbed in the text. 

4.1.1. Perturbed syllables: ki.dya-n (1b3a.4b,-) ‘at his house’, 
compare kii- ‘house’. The morpheme sequence in this form is kii- 
‘house’ plus -da ‘his’ plus -dna ‘at’. The formula is derived from the 
non-elided form *kii.dX-ana (1b 3a.4b,-) with the morpheme break 
indicated following da- and preceding -4na. The elided form 
obscures this morpheme division. ndi.dYi-mi (3b;A.4b,-) ‘(we) kept 
looking at’, cf. naidyi ‘he looks at’; koi.dy4-mu (1b 3a.4b.-) ‘down’ 
(literally down-towards) cf. kdidya ‘down’; tuu. dai-xarana 
(1bgc.4b,-) ‘landing strip’, cf. tudai ‘he lands’; tAXna (1dA) ‘I saw’, 
cf. taXna ‘I found’; kii-yana (1b,-) ‘at the house’, cf. kii ‘house’; 
kX.kx. (3b,B.4b,A) ‘it stands’, cf. kaXkka ‘it stands’; tuu.dai-xai 
(1byc.4b,-) ‘when he was landed’, cf. tudai ‘he lands’; masi 
(1bycU.4b,A) ‘was visible’, cf. ma%i ‘it was visible’. 


4.1.2. Perturbable syllables unperturbed in text. 


k6di (1b,,U) ‘downstream’ cf. koidyasi ‘Is it down- 
< kdi.dY¥a (1b3.U.4b,) stream?’ 
ta.So (1bs-U.4b,U) ‘Tacho’ cf. taasd8i ‘Is it Tacho?’ 
(Spanish nickname 
for Anastacio) 
a.ki (1b,;»U.4b,U) ‘stream’ cf. akisi ‘Is it a stream?” 
da.ma (lb3;-U.4b,U) ‘over’ cf.daamasi ‘Is it over?’ 
kX.vai (1b,»U.4b,U) ‘snow’ cf. kavaisi “Is it snow?” 
ma.8i (lbse-U.4b,U) ‘wasvisible’ cf. maagisi ‘Is it visible?’ 
kX.gai (1bs;»U.4b,U) ‘good’ cf. kagai8i ‘Is it good?” 


no.nda.van (4a.1b3;,U.4b,U) 
‘Nonoava’ cf. nonoavanaii ‘Is it Nonoava?’ 

i.kif.ki (4a.3b,U.4b,U) ‘houses’ . — cf. kiikiSi ‘Are they 
houses ?” 

i.wéi (4a.1b,,U) ‘were making’ cf.iweiydva ‘They are 
making’ 

6.bai (l1bgeU.4b,U) ‘Mexican men’ cf. oobdiSi ‘Are they 
Mexican men?’ 
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A.sai (lbs»U.4b,U) =‘ ‘were planting’ cf. asaii ‘Are they 


planting?’ 
tAX (1dU) ‘He found’ cf. tai ‘Did he find it?’ 
trd.ka (lbs-U.4b,U) ‘truck’ cf. trookasi_ ‘Is it a truck?” 


vo.poi (4a.2b,»U) ‘they run’ cf. vopdiyava ‘They do run’ 
tu.dai (lbs-U.4b,U) ‘he lands’ cf. tuudiata ‘He landed’ 
maa.ta (lbsaU.4b,U) ‘(I) knew’ cf. maatA8i ‘Does he know?’ 


4.2. Examples of the syntactophonemic perturbation types are 
listed below: By-passing for the moment the first perturbed form 
in the text, note that the second, avdégian ma.8i (1bs-U.4b,A) ka.ta 
(3b;B.4bA) kurdrai, was described in Section 3.2. 

Following that in the text, the next perturbed form is ma.ka 
(la.4aA) Sidn im atAma ‘far-away comfortably going we’, cf. the 
isolated form m<ka ‘far-away’. 

Additional examples are: kad duu ndAi.dyi-mi (3b;A.4b,-) 
atXma ‘carefully kept-looking we’, cf. naidYimi atXma ‘kept-looking 
we’, naidyi ‘he looks’; 8i.k6.li (4a.la.4aA) imai ‘it went around’ 
cf. Sikéli ‘around’; maa.tA (1bgaU.4bA) tXé-na (1dA-) ‘knew-how- 
to find-I’, cf. maata ‘knew-how’ and tadna ‘I found’. 

We will now return to the first illustration which we by-passed: 
ali makaSi kAkX (3b,B.4b,A) baaga gidYi ‘quite far stood Eagle 
mountain’. Compare the isolated form kaXka ‘it stands’. Several 
changes are represented by this pronunciation. In the second 
syllable the vowel nucleus is irregularly assimilated in vowel quality 
from a to A. The high tone on the vowel in kA: is a manifestation of 
the regular syntactophonemic perturbation of the expected short 
syllable as it occurs between the high tones of syllables kX and baa. 
The extra half-length of the second syllable (symbolized by a raised 
dot) signals that it is a special drawled hesitation form. As the vowel 
is lengthened for hesitation the pitch drops slightly but not as low 
as phonemic low pitch. As for the first syllable on the other hand 
the changes manifest syntactophonemic Type B in which the 
syllable nucleus of morphophonemic Class 3b is changed from vV 
to V when the affected syllable occurs between two high toned 
syllables. 


Derslext 
Aidyasi vaviliandar ixi athma gdamo koi (1b,,U) da naaximi ant 


When ___ Baborigame left we downstream, back was-looking I. 
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kataSo (4a.1b,-(U.4b,U) kidyan (lb ga.4b,-) dagavusai atAma ali 
Mr. Tacho’s house-at passed-by we, quite 


tXkavaga igidyi gamo koi (1bsaU) naaximi and ali makoroga dai 
high the-ridge. Downstream was-looking I quite far and 


Aa nandava ali makoéroga voibidya atKkma gamo baag abdgi 


back was-looking quite far went-by we, there Eagle (Mt.) behind. 
mmm gi aki (1b,»U.4b,U) dy4ma (1b 3-U.4b,U) fima atXma da 
Hmm. big stream over went we. back 


nandava ali maka kXkX&. (3b,B.4b,A) baaga gidyi maamoxora 
looking quite far it-stood Eagle mountain. Other-side 
dagavusai atXkma gi aki (1b,»U.4b,U) ali gXpiga kAvai (1bspU.4b,U) 
passed-by we big stream. very much snow. 

Avogian ma&i (lbzcU.4b;A) kats (3b;B.4b,A) kurarai waéodi dan 
Scarcely visible as-it-lies the-fence. Guachochic over 


dagavusai athkma vA mai ma%i (1b,-U.4b,U) guika kAgai (1b3»U. 


passed we, still not visible as-they-stood good 


4b,U) babaki moos imai atkma ali gdpiga kAvai (1bspU.4b,U) 


houses. just kept-going we. very much snow 


gigidyiamu maaka’iga nondavan (4a.lb,;,U.4b,U) dagavusai atXma 
on-the-mountains. Far-away, Nonoava passed-by we. 

gxkXdoi aki (1b,»U.4b,U) mos taaddégi suudagi muidyu ikiiki 
big stream, just green water, many houses, 


(4a.3b,U.4b,U) muidyu itavla Sidxogaiwéi (4a.1b,»U) dba 
many boards. Where (they)-made-(them)  the-Mexicans. 


(1bs-U.4b,U) muidyu dad&varai Siaxogai Asai (1b3»U.4b,U) 
Many plots-of-land where (they)-planted 

didyaxami mosimai _atAma tdAkavi baivastan mil pié tXhka ima 
the-inhabitants. just-kept-going we high. Ten thousand feet high going 
atXma ikéma saagifia tadagavusai lalati kAikasai urugi dai apAan 
we cloud through we-passed. A-little kept-dipping the-plane and again 
tAsadai Sigal tyddatarai giflibydaga dai kékotugi and bai kavami 
it-kept-going-up. Badly it-was-feeling my-heart and was-being-made-sick I very much. 
maiSi bai tadaga vASkara koidY4mu (1bya.4b,) ananAni 4nx ali 
Not very feeling-well still downwards was-looking I. quite 


thkava matana dai tituvidya gaagXradu moskokémagi kak dtu 
high down-below. And hills big just-gray. With-care 
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mXka (la.4aA) Sidn im atAma daida tkx (1dU) ¢iwaawana ali 
far comfortably were-going we and saw Chihuahua very 


muidYu ikifki (4a.3b,U.4b,U) kad di nXidyimi (3b,A.4b,-) athma 


many houses. with care were-looking-at we 


itroka (4a.1b,-U.4b,U) alidyu dai tru tuudaixarana (1b,5.4b,-) 
trucks little. And plane (lit. Bird) landing-place, 


moSikdli vopdi (4a.2b,»U) uxurugi kaX duu sikdli (4a.la.4aA) imai 
just-around they-ran the-planes. with-care around was-going 
urugi moduu tuidai (1b,-U.4b,U) tuudaixai (1bgc.4b,-) vASkara 
the-plane there-carefully it-landed. When-it-had-landed still 

maatk (1b3aU.4b,A) tXAna (1dA-) Siddara ddivusai imaxai maigé 
knew-how-to find-I where we-had-passed. When-went-we another 


kityana (1b,.-) muidyu dbai (1b,-U.4b,U) andaraxa atkma 


house-to many people there-sat we. 


Summary 


A recent article in this journal (Phonetica Vol. 3, p. 1-22) 
treated the problem of interpretation of pitch and stress in Northern 
Tepehuan. This article showed how an instrumental analysis of a 
few apparent contrasts of pitch or stress served to give direction to 
an analyst who was undecided as to the exact nature of these 
contrasts. The report of this instrumental analysis made it impera- 
tive to follow up the pitch hypothesis. 

The present paper reports how the pitch hypothesis was con- 
firmed under auditory conditions. This conclusion is strongly sup- 
ported by items showing contrast in lexical pitch beyond those 
available in the earlier article. Further support developed by way 
of the system of tonal morphophonemic changes which reflect an 
elaborate, highly regular patterning of tone relationships in the 
language. The bulk of this paper is concerned with the presentation 
of these tono-mechanical changes. 


Kusammenfassung 


Ein voraufgegangener Artikel (Phonetica 3. Jg., S. 1-22) behandelt das Problem 
der Interpretation von Tonhéhe und Akzent im nérdlichen Tepehuan. Der Artikel 
zeigte, wie eine instrumentelle Analyse von wenigen Fallen, wo Gegensatze zwischen 
der Tonhéhe und dem Akzent auftraten, dazu diente, dem Untersuchenden, der iiber 
die genaue Natur dieser Gegensatze im Zweifel war, die Richtung zu weisen. Auf Grund 
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der Ergebnisse der instrumentellen Analyse muBte der Tonhéhenhypothese nach- 
gegangen werden. 

Der vorstehende Artikel berichtet dariiber, wie sich die Tonhéhenhypothese beim 
HGren bestatigte. Die sich ergebende SchluBfolgerung wird stark gestiitzt durch solche 
Falle, die lexikalische Tonhdhengegensatze zeigen; deren Anzahl ist gegeniiber dem 
friiheren Artikel vermehrt. Die Hypothese wird auBerdem gestiitzt durch das System 
des morphophonemischen Wechsels der Tonhdhen, was sich in dieser Sprache in den 
genau festgelegten und sehr regelmaBig verwendeten Modellen fiir das Verhaltnis der 
Téne zueinander spiegelt. Der Hauptteil der Arbeit bringt den Mechanismus dieser 
Tonwechsel zur Darstellung. 


Résumé 


Un précédent article (Phonetica 3, pp. 1-22) traitait le probléme de l’interpréta- 
tion de la hauteur et de l’accent en tepehuan septentrional. L’article montrait comment 
l’analyse instrumentale d’un petit nombre de cas oi apparaissaient des oppositions entre 
hauteur et accent montrait la voie au chercher pour déterminer la nature exacte de ces 
oppositions. Sur la base des résultats de l’analyse, il fallait adopter ’hypothése de la 
hauteur. 

Le présent article rend compte de la fagon dont l’hypothése de la hauteur a été 
confirmée a l’audition. Cette conclusion est fortement étayée par les cas qui présentent 
des oppositions lexicales de hauteur, dont le nombre est accru par rapport au premier 
article. L’hypothése est en outre confirmée par le systéme de variation morphophoné- 
mique des hauteurs, ce qui se refléte dans cette langue dans les schémes établis avec 
précision et employés avec la plus grande régularité pour les relations des tons entre eux. 
Le corps du travail expose le mécanisme de ces variations de hauteur. 
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The Predictability of Stress in Lebanese Arabic 
By Raja T. Nasr 


A few symbols and technical terms used in this paper must be 
explained before proceeding. 


Terminology 
c stands for consonant. 
v stands for vowel. 


Stress. Stress means the relative force of the breath produced in 
uttering sounds. The same word stress is applied to words 
as well as to sentences. 


Long syllable. A long syllable is one that contains a vowel cluster 
(the same vowel geminated or two different vowels) or 
one vowel followed by a consonant cluster (the same 
consonant geminated or two different consonants). 


CVU, CVUC, CvUCC, OY CLEC 


Short syllable. A short syllable is one that contains one vowel 
followed either by nothing or by one consonant. 


cv or cue 


Stress in one dialect of Lebanese Arabic follows a very regular 
pattern. All words containing similar syllabic formations have 
similar stress patterns when uttered in isolation. However, the degree 
of stress in some prepositions, function syllables, and words in 
included positions may be reduced in a sentence, depending on the 
meaning that the speaker wishes to elicit. It is this exceptionally 
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regular stress pattern that contributes most to the staccato rhythm 
so apparent in spoken Lebanese Arabic. 


Number of Word Stress Levels 


Monosyllabic words like 
[min] ‘‘from” 
[dal] “‘he said” 
[Suu] ‘“‘what” 
[Saff]* “class” 


naturally take only one stress, which when uttered in isolation is the 
loudest, and which shall henceforth be called primary stress and shall 
be designated by the sign ["]. 


Disyllabic words like 
[?inni]  ‘“‘that I” 
[?aalu] ‘‘they said” 
[kasart] “I broke” 
[?aMiiS] ‘‘shirt”’ 


contain one syllable (the first in the first two words and the second 
in the last two) with a stress as strong as the primary stress in 
monosyllabic words. The other syllables have a weaker stress, the 
value of which can only be determined in comparison with other 
stress levels. 


Trisyllabic words like 
[farziini] “‘show me” 
[kassartu] “I broke it” 
[*ihtimaam] “his concern” 
[sizzaadi] ‘‘carpet”’ 


contain one syllable with a stress equivalent in strength to the 
primary stress in monosyllabic words. They also contain another 
syllable each with a stress weaker than primary stress but stronger 
than the weaker stress found in the disyllabic words above. This 
medium stress shall henceforth be called secondary stress and shall 
be designated by the sign [*]. The remaining unmarked-for-stress 
syllables have a stress weaker than secondary stress and equivalent 
to the weaker stress found in disyllabic words. This weak stress 


* Velarization is indicated by capitals. 
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shall henceforth be called tertiary stress and shall be designated by 
no stress sign. 

Other stress values than primary, secondary, and tertiary have not 
been detected in Lebanese Arabic. 


Hypothesis of Predictability* 


Monosyllabic words containing either a short or a long syllable 
take primary stress. 


Examples 
[min] ‘‘from”’ 


[Saff] “‘class’’ 


Beginning with the end of a word and moving back, the first 
long syllable takes primary stress; the other long syllables (if any) 
take secondary stress; all short syllables (if any) take tertiary stress. 


Examples 
[TaawutuS] “peacock” 
[sizzaad] “carpets” 
[9aZiiM] “great” 
[saa il] “‘asking”’ 


x 


[sizzaadaatna] ‘‘our carpets” 
[?awaamirna] ‘‘our orders” 


The first syllable in a word containing two or three short 
syllables takes primary stress; the rest take tertiary stress. 


Examples 
[masa] “evening” 
[samak]  ‘‘fish” 
[kamasu] ‘“‘he caught him” 
[sA?a]it]  “‘she asked” 


* The patterns presented here apply to all words in this dialect. In another dialect 
of Lebanese Arabic, the patterns apply to all words except some verbs inflected for third 
person singular feminine. This other dialect is one variety of Lebanese Colloquial Arabic 
not limited geographically to any special linguistic community. Here the morphological 
inflection is — [a] instead of — [ha], which changes the syllabic formation of the word 
without affecting the place of the primary stress. 


For example: 


Dialect under study Other dialect 
[kamaSha] “he caught her” [kamaSa] ‘‘he caught her” 
[ha8aRa] “insect” [ha8aRa] ‘‘insect”’ 


[ha8S4Rha] “he cornered her” [haS4Ra] “he cornered her” 
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The third syllable in a word containing four short syllables 
takes primary stress; the rest take tertiary stress. 


Examples 
[kamaSitu] “‘she caught him” 
[sa?alitak] ‘‘she asked you” 


Sentence Stress 


In addition to fixed word stress levels, there is a moveable 
sentence stress in Lebanese Arabic. Normally, this sentence stress 
falls on the last primary stress in the sentence or utterance. It is move- 
able, however, in accordance with the total meaning that the 
speaker wishes to elicit. 

Sentence stress is contextually emic; that is, a change in the 
position of the sentence stress produces a contextually-significant differ- 
ent referential meaning*. 


For example, in 


[hdyda wdlad mnith] ‘‘This is a good boy” 
this boy good 


if the sentence stress falls on [hayda] ‘“‘this’’, the sentence would 
imply that it is this (rather than any other) boy that is good; if the 
sentence stress falls on [walad] “boy”, the sentence would imply 
that this is a good boy (rather than a good girl); if the sentence stress 
falls on [mniih] ‘“‘good”, the sentence would imply that this is a 
good (rather than a bad) boy. Each one of these different referential 
meanings is significant in a particular contextual set up. 

Often this shift in the sentence stress involves syntactical mo- 
difications, as in the case of emphatic-reflexive pronouns. For example, 


[kiifak] ““How are you?” 
[kiifak inta] “How are you?” 
[hayda ili] “This is mine” 


* The use of the terms different referential meaning is more accurate than what some 
linguists call differential meaning. I contend that arithmetical conceptions are not nec- 
essarily applicable to language elements. In arithmetic, five has a referential meaning; 
three has a different referential meaning; two, the difference between five and three, has 
a still different referential meaning that may be called the differential meaning between 
the first two referential meanings. This cannot apply to language. My friend is good 
and J drive a car are two sentences with two different referential meanings. They have no 
differential meaning because of the fact that their meanings are not substractable. 
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[hayda ili ?4na] ‘‘This is mine” 
this mine I 


Practical Application 


From the standpoint of pure linguistic theory, the complete 
predictability of stress in one dialect of Lebanese Arabic would 
mark it as non-phonemic. Although this predictability applies in 
well over 95 per cent of the cases in all other dialects of Lebanese 
Arabic, its partial unpredictability would mark it as phonemic. 

Linguistic theory aside, the practical application of a study of 
stress lies in teaching and learning Arabic as a foreign language 
and in having native speakers of Lebanese Arabic learn foreign 
languages. For a Lebanese Arab, the problem of stress in a foreign 
language where stress is unpredictable (e.g. English), is very serious, 
for he can only master it by learning the stress of individual items. 
For a foreigner wanting to learn Lebanese Arabic, the problem 
reverses itself. If in the language of the foreigner, stress has different 
predictable patterns (e.g. Farsi), he will have to develop new 
automatic habits in the use of the new Lebanese Arabic stress 
patterns; but if in his language, stress is unpredictable, he will 
have to develop automatic habits in the use of the Lebanese Arabic 
stress patterns; of these two, the second is relatively easier for the 
learner, as no unlearning of old habits is involved. 


Summary 


There are three levels of word stress in Lebanese Arabic — 
primary [.], secondary ["], and tertiary [ ]. The occurence of these word 
stress levels is completely predictable in one dialect and almost 
completely predictable in all others. The predictability of the stress 
levels follows a set of regular patterns based on the length and 
number of syllables in a word. 

Pattern 1. Monosyllabic words containing either a short or a 
long syllable take primary stress. 

Pattern 2. Beginning with the end of a word and moving back, 
the first long syllable takes primary stress; the other long syllables 
(if any) take secondary stress; all short syllables (if any) take 
tertiary stress. 

Pattern 3. The first syllable in a word containing two or three 
short syllables takes primary stress; the rest take tertiary stress. 
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Pattern 4. The third syllable in a word containing four short 
syllables takes primary stress; the rest take tertiary stress. 

In addition to fixed word stress levels, there is a sentence stress 
that is moveable in accordance with the total meaning that the 
speaker wishes to elicit. 


Kusammenfassung 


Das libanesische Arabisch unterscheidet beim Wortakzent drei Grade — den 
ersten [’], den zweiten [‘] und den dritten [ ]. Welcher dieser drei Grade auftritt, ist in 
einem Dialekt genau vorherzusagen, in den anderen meistens. DaB man voraussagen 
kann, welcher Grad des Akzents verwendet wird, beruht auf einigen Regeln, in denen 
die Lange der Silben und ihre Anzahl im Wort eine Rolle spielen. 

Regel 1. Einsilbige Woérter, sowohl kurz- wie langsilbige, haben den Akzent ersten 
Grades. 

Regel 2. Am Ende des Wortes beginnend und riickwartsgehend, trifft der Akzent 
ersten Grades die erste lange Silbe; die tibrigen langen Silben (wenn vorhanden) haben 
den Akzent zweiten Grades; alle kurzen Silben (wenn vorhanden) haben den Akzent 
dritten Grades. 

Regel 3. Wenn ein Wort aus zwei oder drei kurzen Silben besteht, tragt die erste 
Silbe den Akzent ersten Grades; die tibrigen Silben einen Akzent dritten Grades. 

Regel 4. In einem Wort mit vier kurzen Silben tragt die dritte Silbe den Akzent 
ersten Grades; die tibrigen Silben einen Akzent dritten Grades. 

Neben den feststehenden Wortakzenten gibt es einen Satzakzent, der sich ver- 
schiebt, je nachdem, was der Sprecher betonen will. 


Résumé 


Il y a trois niveaux accentuels dans le mot en arabe libanais: primaire [’], secon- 
daire [*], tertiaire [ ]. On peut prédire l’apparition de ces niveaux accentuels de facon 
exhaustive dans un dialecte et de fagon presque compléte dans les autres, d’aprés des 
régles fondées sur la longuer et le nombre des syllabes dans le mot. 

Régle 1. Les monosyllabes, que la syllabe soit longue ou bréve, comportent l’accent 
primaire. 

Kégle 2. La premiére syllabe longue en partant de la fin du mot regoit l’accent pri- 
maire; les autres syllabes longues, s’il y en a, recoivent l’accent secondaire; toutes les 
syllabes bréves, s’il y en a, comportent l’accent tertiaire. 

Régle 3. Dans un mot constitué par deux ou trois syllabes bréves la premiére 
recoit l’accent primaire, les autres l’accent tertiaire. 

Régle 4. Dans un mot constitué par 4 syllabes bréves, la troisiéme recoit l’accent 
primaire, les autres l’accent tertiaire. 

En plus de ces niveaux accentuels fixes, il existe un accent de phrase mobile dont 
la place dépend du désir de la part du locuteur de mettre en valeur tel ou tel élément. 
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Einfiihrung in die Informationstheorie 
unter Beriicksichtigung phonetischer Probleme 


Von G. UNGEHEUER, Bonn 


1. Eingrenzung des Untersuchungsfeldes 


Der Ansto8 zu informationstheoretischen Gedankengangen 
kam aus der Fernmeldetechnik, deren Aufgabenkreis darin besteht, 
optimale Mittel der Nachrichteniibertragung zu schaffen. Dort be- 
trachtet man jeden KommunikationsprozeB unter dem Aspekt, daB 
ein «Sender» iiber einen «Kanal» mit einem «Empfanger» ver- 


bunden ist (Abb. 1). 


Empfanger 


Kanal 


Abb. 1 


Beispiele fiir dieses Schema lassen sich leicht anfiithren: Ge- 
sprach, Fernsehen, Messung physikalischer GréBen, Telegraphie. 
An einem dieser Beispiele, am Gesprach, wie es sich in einer natiir- 
lichen Sprache vollzieht, entwickeln wir das Wesen der Informa- 
tionstheorie. Sprecher und Horer als «Sender» und « Empfanger» 
sind die Kommunikationspartner. 

Das erste, was wir an sprachlichen AuBerungen erkennen kén- 
nen, ist die Zweiheit von Sprachkérper und Sprachsinn. Unter 
Sprachkérper verstehen wir die Gesamtheit aller Voraussetzungen 
materieller, organischer und seelischer Natur, die den duferen 
Verlauf des Gesprichs sicherstellen: die Bewegungen der Artikula- 
tionsorgane, die Schwingungen der Luft, die wahrgenommenen 
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Schallqualitaéten und diese vor allen anderen, denn mit ihnen allein 
verkniipft das SprachbewuBtsein die Inhalte, die geduBert und 
verstanden werden. Diese Verkniipfung der Inhalte mit sinnlich 
wahrnehmbaren Gebilden, mit einem materiellen Substrat, das auf 
die Inhalte hinweist, sie vertritt und damit eine Kommunikation 
erst erméglicht, erfassen wir im Begriff « Zeichen» und nennen seine 
beiden Konstituenten nach logischem Brauch «designans» und 
«designatum», Zeichenkérper und Bedeutung. Die Eigentiimlich- 
keit des Zeichens offenbart sich in dem hinweisenden Bezug, dem 
«aliquid stat pro aliquo», eines Designans zu seinem Designatum. 
Insbesondere wird man daher jedes Wort einer Sprache, begreift 
man es als Einheit von Sinn und Lautgestalt, ein sprachliches 
Zeichen nennen kénnen. 

Sprecher und Horer verstehen einander nur dann, wenn beide 
in gleicher Weise die Zeichenkérper mit den Bedeutungen verbin- 
den; es besteht zwischen ihnen eine Art Konvention, durch welche 
sie tiber die gleiche Zeichenmenge, die wir kiinftig mit M symbo- 
lisieren, verfiigen. Im « Kanal» flieBen nur die Zeichenkérper. Sie 
dienen dem Empfanger als Kennmarken, die ihn veranlassen, den 
zugehorigen Sinngehalt ins BewuBtsein zu heben. 

Damit die Zeichenkérper als Merkmale der Bedeutungen 
fungieren kénnen, miissen sie identifizierbar, d.h. fiir die Wahrneh- 
mung unterscheidbar sein; und zwar miissen ihre Gestalten sich 
um so kontrastreicher auspragen, je mehr Elemente das Reservoir M 
umfaBt. 

Enthalt M beispielsweise nur zwei Worte, dann geniigt zur 
Kennzeichnung der Wortkérper ein einziges unterscheidendes 
Merkmal, das die wahrnehmbaren Schallereignisse in zwei Klassen 
teilt, die durch das Vorhandensein bzw. Fehlen des Merkmals 
charakterisiert sind. Tritt ein weiteres Wort hinzu, dann sind zur 
Identifikation der Zeichengestalten mindestens drei solcher Klassen, 
also mindestens zwei kontrastierende Merkmale erforderlich. In 
dieser Weise mu8 das Wahrnehmungsfeld mit wachsender Wortzahl 
(Zahl der Elemente in M) immer reicher strukturiert werden. Die 
Gesamtheit der Klangqualitaten, die als Merkmale die Zeichen- 
kérper sondern, nennen wir das «diakritische System» der Zeichen- 
menge. 

Ein Wort tragt, so kénnen wir jetzt feststellen, in zweifacher 
Weise Information: zunachst seinen Sinn, die Information im her- 
kémmlichen Verstindnis, und dann — an seiner auBeren Gestalt — 


' 
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Diakritika, die distinktive Information, wie wir sie bezeichnen wollen, 
die es dem H6rer erméglicht, prazise zu erkennen, welchen Zeichen- 
kérper er empfangen hat. Diese distinktive Information ist das Thema 
der Informationstheorie. 

Ihr kommt es nicht auf die Inhalte der Zeichen an; sie behalt 
nur die Bestimmung bei, daB die Zeichen Unterschiedliches be- 
deuten, und geht dann dazu iiber, das System der unterscheidenden 
Merkmale und deren Verkettung im Kontext zu untersuchen. 
Hierbei abstrahiert sie auch von den Qualitaten der ausgebildeten 
Kontraste und begniigt sich damit, an einem Schema die formalen 
Kriterien des Systems zu bestimmen. Prinzipiell besteht ein Ziel 
der Informationstheorie darin, fiir die distinktive Information MaBe 
(d.h. MaBzahlen) herzuleiten. Daher kann sie auch die Struktur 
beliebiger Elementmengen, deren Individuen keine Zeichen sind, 
analysieren. So werden Betrachtungsweisen der Informations- 
theorie beispielsweise bei Katalogisierungsproblemen in Bibliothe- 
ken, bei Fragen der Klassifizierung in Biologie und Chemie, bei 
taxonomischen Untersuchungen jeder Art und bei Schaltungs- 
problemen elektronischer Rechenmaschinen angewendet. 


2. Das Informationsvolumen 


Wir beschaftigen uns in diesem Kapitel mit der Frage nach der 
kleinsten Merkmalmenge, mit der die Elemente aus M (ihre Anzahl 
bezeichnen wir mit €) differenziert werden kénnen. Die Zahl der 
méglichen Merkmalkombinationen soll genau mit der Zahl € der 
Zeichenkérper iibereinstimmen, so da8 zur Kennzeichnung das 
diakritische System voll ausgeschépft wird. Wir erértern also die 
Bedingungen, unter denen eine Elementmenge M mit dem gering- 
sten Aufwand an wahrnehmbaren Qualitaten distinktiv ausge- 
staltet werden kann: wir errichten das Schema eines optimalen 
Kontrastsystems. In diesem Optimalsystem besitzt jedes Element, 
wie sich herausstellen wird, die gleiche distinktive Information, die 
wir das Informationsvolumen der Elemente hinsichtlich der Ausgangs- 
menge M nennen. 

Die kleinste Zeichenmenge besteht aus einem einzigen Element. 
Um es identifizieren zu kénnen, miissen wir ihm mindestens ein 
Merkmal zuordnen. Da aber, wie wir bereits feststellten, die Ab- 
wesenheit eines Merkmals als unterscheidendes Mittel brauchbar 
ist, ist zur Erkennung zweier Zeichenkérper kein zusatzliches 


8 Phonetica, Vol. 4, No. 2/3, 1959 
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Diakritikum erforderlich. Erst bei drei Designantes miissen wir ein 
zweites Merkmal in das System einfiihren. 

Die kleinste distinktive Information besteht also offenbar in 
einer Zweiteilung, einer binaren Klassifikation der Zeichenmenge M, 
in einer Distinktion im wahren Sinne des Wortes. In Hinsicht auf 
den Kommunikationsakt laBt sie sich als eine Aufforderung an den 
Empfanger deuten, die Menge der Sinneinheiten nach vereinbarter 
Konvention in zwei Halften zu teilen, und als eine Versicherung, 
daB das gemeinte Element sich in der einen Halfte befindet. Diese 
minimale Information bestimmt die Theorie als MaBeinheit und 
nennt sie «1 Bit» (zusammengezogen aus «binary digit») }. 

Die informationstheoretischen Ma8e sind nun anderer Natur 
als diejenigen der Physik. Wahrend dort Eigenschaften der Ma- 
terie beschrieben werden, konstruiert die Informationstheorie ein 
Modell, an welchem durch Vergleich das diakritische System einer 
Zeichenmenge ausgemessen wird. Dieses Schema besteht in einer 
Auswahl- oder Klassifikationsvorschrift, deren einfachste Auswahl- 
akte der Informationseinheit «1 Bit» entsprechen. 

Das Klassifikationsmodell, das unser Problem zu lésen vermag, 
demonstrieren wir an einem Bedeutungsfeld mit acht Sinneinheiten, 
die wir mit den Buchstaben A bis H bezeichnen (Abb. 2). 


LA Bid Ditch age setae pple 


000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 | 3. Merkmal 


00 | 01 | 10 | 11 | olirenansl 


ToNtecenal 
Abb. 2 


Zuerst wird das ganze Feld in zwei gleichgrofe Teilmengen ge- 
schieden, die wir mit 0 und 1 symbolisieren. Diese werden wieder 
in jeweils zwei Untermengen gleicher Elementzahl aufgeteilt und 
eine 0 oder | der bereits vorhandenen Ziffer angefiigt. Die binare 
Dekomposition wird so lange fortgesetzt, bis die Elemente selbst 
erreicht sind, In unserem Beispiel gelingt die Selektion in einer drei- 


? Die Betrachtungsweise der Informationstheorie hat in diesem Punkte Ahnlichkeit 
mit einem bekannten Fragespiel. Es soll beispielsweise der Beruf einer Person ermittelt - 
werden. Auf Befragen darf die Person nur mit «ja» oder «nein» antworten (An- oder 


Abwesenheit des Merkmals!), Jedes «ja» oder «nein» entspricht der Informations- 
einheit 1 Bit. 
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fachen Aufgliederung des Bedeutungsfeldes. Gema8 unserer De- 
finition besitzt daher jedes Element ein Informationsvolumen von 
3 Bit. Zu den Ziffern 0 und 1, aus denen die Dualzahlen unseres 
Modells gebildet sind, bemerken wir, daB sie beliebig durch zwei 
andere Symbole ersetzt werden kénnen. Nur mathematische Erwa- 
gungen, auf die wir hier nicht eingehen, bringen den Gebrauch der 
Ziffern mit sich. Jeder Binarklassifikation entspricht die Existenz eines 
Unterscheidungsmerkmals, wobei | sein Vorhandensein und 0 sein 
Fehlen andeutet. Daher bezeichnet jede Stelle der Dualzahlen ein 
bestimmtes Diakritikum. Das Sinnelement F beispielsweise wird in 
unserem Beispiel durch die Zahl 101 als Zeichenk6rper repra- 
sentiert, d. h. aber, daB es durch die Merkmalkombination «An- 
wesenheit des 1. Merkmals — Abwesenheit des 2. Merkmals — An- 
wesenheit des 3. Merkmals» identifizierbar ist. Der mathematische 
Ausdruck des Informationsvolumens J lautet 


J =lde Bit 


«ld» bedeutet den Logarithmus zur Basis 2 (Logarithmus dyadicus). 
Nach dieser Formel erhalten wir fiir acht Zeichen tatsachlich 
J =1d 8 =3 Bit. Nehmen wir in einer Sprache einen Wortschatz 
von | Million Wortern an, dann ergibt die Rechnung, daB jeder 
Wortkérper ein Informationsvolumen von ungefahr 20 Bit besitzt. 
Zu einer optimalen Kennzeichnung dieses Vokabulars im obigen 
Sinne waren also nur 20 Merkmale erforderlich. Wiirden wir nur 
ein weiteres Merkmal hinzufiigen, erhielten wir die Méglichkeit, 
2 Millionen (!) Wortkérper vonein anderzu sondern. 

Allerdings ist die Symmetrie des Optimalsystems bei wirklichen 
Merkmalsystemen nur selten anzutreffen. Erstens ist das Infor- 
mationsvolumen in den wenigsten Fallen ganzzahlig (nur dann 
namlich, wenn die zu kennzeichnende Klasse € = 2) Individuen 
enthalt); im allgemeinen sind zweitens die Zeichenmengen dia- 
kritisch durchaus nicht so ausgebildet, daB jedes Zeichen die 
gleiche distinktive Information tragt. In beiden Fallen ist das 
diakritische System redundant, d.h. mit den verwendeten Merk- 
malen kénnte ein umfangreicherer Elementkomplex differenziert 
werden, als es in Wirklichkeit geschieht. Die distinktive Information 
ist im Gegensatz zum Optimalmodell ungleichmafig iiber die 
Elemente verteilt. 

An unserem Beispiel mit acht Sinneinheiten zeigen wir eine 
redundante Aufgliederung des Bedeutungsfeldes (Abb. 3). 
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011000 | 011001  Moaeraal 


01100 01101 5. Merkmal 


0110 4. Merkmal 
O11 3. Merkmal 
01 2. Merkmal 


1. Merkmal 


Abb. 3 


Das Element H wird bereits mit einer Selektion erreicht und 
tragt daher 1 Bit Information; fiir A, B, C benétigt man drei 
Selektionen (3 Bit Information); die Information von G betragt 
4 Bit, von F 5 Bit, von D und E 6 Bit. Bei optimaler Ausnutzung 
der sechs Merkmale, d. h. bei 6 Bit Information fiir jeden Zeichen- 
kérper kénnten € = 2° = 64 Sinneinheiten bezeichnet und dem 
Empfanger iibermittelt werden. 

Ist der Betrag des Informationsvolumens eine gebrochene Zahl, 
so kénnen wir ihn als einen Mittelwert aus den ihn oben und unten 
einschlieBenden, ganzzahligen Informationsbetraégen ansehen. DaB 
diese Werte den Elementen zugeordnet sind, erkennt man aus dem 
folgenden Beispiel mit sechs Bedeutungseinheiten A bis F (Abb. 4). 
Zwei Einheiten erreicht man schon mit 2 und die iibrigen mit 
3 Selektionen; ihr Informationsvolumen berechnet sich formal zu 
J =1d6 =2,6 Bit. Aus dem Beispiel sieht man, daB gebrochene 


Ail dsr sg GoD slide we Fara 


010 | 011 110 | 121. \2 s:ihtereet 


00 01 10 ll 2. Merkmal 


| 1. Merkmal 


Abb. 4 


Informationsvolumina immer dann auftreten, wenn beim binaren 
AufgliederungsprozeB eine Teilmenge nicht mehr in gleichgroBe 
Untermengen geschieden werden kann. Behalt man jedoch das 
Schema im Auge, dann kann man unbekiimmert auch mit nicht 
ganzzahligen Informationsbetrégen sinnvoll rechnen. 
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3. Redundanz und Entropie 


Unsere nachste Aufgabe besteht darin, ein geeignetes MaB fiir 
die Redundanz eines diakritischen Systems zu finden. Hierzu be- 
notigen wir vor allem eine experimentell leicht faBbare GréBe, in 
der sich die individuelle Information der Zeichenkérper ausdriickt. 
Wir miissen uns einen Zugang zu diesen Informationswerten, die 
uns ja nicht vorgegeben sind, die wir vielmehr aus der 4uBeren 
Gestalt eines Nachrichtentextes herauslésen wollen, verschaffen und 
mit ihnen das gesuchte RedundanzmaB8 ableiten. Dieses Vorhaben 
gelingt durch eine Neuinterpretation unseres Selektionsmodells. 

Das Modell, das wir unseren bisherigen Betrachtungen zu- 
grunde gelegt haben, ist nicht nur als ein Klassifikationsschema zu 
verstehen, an welchem man nach vorheriger Bestimmung der MaB- 
einheit die distinktive Information ausmifbt, sondern auch als eine 
schematische Darstellung des Sendeaktes selbst. Bei dieser Deutung 
hat man sich das Zusammenfiigen eines Nachrichtentextes als ein 
Aneinanderreihen von Ziffern 0 und 1, von binéren Auswahlakten 
also, zu Zeichenkérpern und dieser Zeichenkérper zu einem Text 
vorzustellen. Da die Informationstheorie ihre Begriffsbestimmungen 
unabhangig vom Sinnzusammenhang der Nachricht einfiihrt, er- 
scheint der Sender als Quelle einer Zufallsfolge von 0 und 1 (oder 
zweier anderer Symbole), die von bestimmten statistischen Gesetz- 
maBigkeiten beherrscht wird. Wir machen nun die fundamentale 
Voraussetzung, da dem Sender keinerlei Bedingungen auferlegt 
sind, eine der beiden Ziffern bei der Wahl vor der anderen zu be- 
vorzugen; thr Erscheinen im Text nehmen wir als gleichwahrscheinlich an. 

Nach den Gesetzen der Wahrscheinlichkeitstheorie besitzt jede 
der beiden Ziffern den Wahrscheinlichkeitswert p = . Hieraus 
1aBt sich unmittelbar deduzieren, daB einem Zeichenkérper eine 
um so kleinere Wahrscheinlichkeit zuzuordnen ist, je gréBer seine 
distinktive Information ist. Denn fiir eine Zahl aus zwei Ziffern 
(z. B. 01) liefern die wahrscheinlichkeitstheoretischen Theoreme 

de alk 1 l 


a5 sae fiir eine dreiziffrige Zahl p = 


den Wert p = 


ir a> = = und so weiter. Fiir unser Beispiel (Abb. 3) ergibt 


sich daher folgende Wahrscheinlichkeitsverteilung: 
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A B Cc D E F G H 


3 3 3 6 6 5 4 
1 1 1 1 1 


ZF Ze 7h) Ze 25 28 7h 


Information in Bit 


Wabhrscheinlichkeit 


n| — 


Allgemein 148t sich das Verhaltnis zwischen distinktiver In- 
formation J (zi) eines Elementes z; und seinem Wahrscheinlich- 
keitswert p(zi) folgendermaBen ausdriicken: 


1 
pizy.= RICH) oder J(zi) =-1d p(zi) 


Mit diesem Ergebnis gelangt man unmittelbar zu einem der 


wichtigsten MaBe der Informationstheorie und weiter zu dem ge- » 


suchten RedundanzmaB. 
Die mittlere Information H aus allen diesen individuellen Bei- 
tragen J(zi) erhalt man in der GréBe 


H =~ p(z,) Id p(z) — p(Ze) Id p (zs) — p(s) Id p (zs) —... = 
¢ 
-& p(zi) Id p (zi) 


1 


H wird in Analogie zu einem ahnlichen Ausdruck der statisti- 
schen Mechanik « Entropie» oder wegen des Zusammenhanges mit 
den Auswahlakten des Modells «selektive Information» genannt. 
Sie erreicht ihr Maximum fiir gleichwahrscheinliches Auftreten der 
Zeichen und wird in diesem Falle gleich dem Informationsvolumen 


Hmax = J 


Jede Veranderung im Gleichgewicht der Wahrscheinlichkeiten 
verringert die Entropie und vergréBert die Redundanz. Die Diffe- 
renz zwischen der effektiv vorhandenen Entropie und ihrem ma- 
ximalen Wert ist der Redundanz proportional und kann daher als 
ihr MaB bestimmt werden. Genauer definiert man als Redundanz- 
mas r 

J-H H 

ah J 


Die Entropie ist eine GréBe, die den Erfordernissen der Praxis 
geniigt. Da Wahrscheinlichkeiten durch relative Haufigkeiten 
approximiert werden, diese aber im Text nur ausgezahlt zu werden 


r 
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brauchen, kann die selektive Information verhaltnismaBig einfach 
bestimmt werden. — 

Zur Veranschaulichung seien hier einige Entropie- und Re- 
dundanzwerte angegeben. Das Englische verwendet 26 Buchstaben, 
woraus man ein Informationsvolumen von 4,7 Bit errechnet. Die 
effektive Entropie englischer Drucktexte betragt dagegen nur 
2,3 Bit pro Buchstabe. Damit ergibt sich hinsichtlich der Buch- 
staben im geschriebenen Englisch eine Redundanz von 0,5. Die 
Entropie pro Wortkérper betragt im Englischen 11,8 Bit. Der Wort- 
schatz des Englischen hat — grob gesprochen — einen Umfang zwi- 
schen 1 Million und 2 Millionen Wortern, also, wie wir bereits fest- 
stellten, ein Informationsvolumen zwischen 20 und 21 Bit. Demnach 
erhalt man auch fiir die Worte des Englischen eine Redundanz von 
ungefahr 0,5. 


4. Informationsrate und Kanalkapazitat 


In einem Nachrichtentext erscheinen die Zeichenkérper und 
ihre Teile nicht unabhangig voneinander. Sinnzusammenhang, 
syntaktische Regeln und individuelle Eigenart des Stils - um nur 
die wesentlichen Einflu8gr6Ben zu nennen — beherrschen den Ver- 
lauf der Zeichenfolgen derart, daB die Elemente mehr oder weniger 
stark von den Zeichen ihrer Umgebung determiniert sind. Ein 
Designans bedarf also zu seiner Identifikation um so weniger di- 
stinktive Information, je fester es mit seiner Umgebung verkniipft 
ist. Die am Ko6rper selbst nicht mehr erforderlichen Kontraste 
werden durch den Zwang, der das Zeichen lose oder fest an eine 
bestimmte Position in der Zeichenkette bindet, kompensiert. Ist 
beispielsweise das Element durch seine Umgebung eindeutig de- 
terminiert, dann wird es nur noch mit Hilfe seiner Position im Text 
erkannt und auf diese Weise von den iibrigen geschieden. 

Mathematisch laBt sich die Abhangigkeit der Zeichen ange- 
nahert mit den Ubergangswahrscheinlichkeiten pz, (zj) beschrei- 
ben. Dies ist die Wahrscheinlichkeit dafiir, daB das Zeichen zj dem 
Zeichen z; im Text nachfolgt. pz, (zj) reprasentiert den statistischen 
Abhangigkeitsgrad zwischen z; und z;. Durch weitere Uberlegungen 
gelangt man zu einem mittleren InformationsmaB Hz, (z;) der 
Zeichenkorper, ein entropieahnlicher Ausdruck, der aber im Gegen- 
satz zur Entropie die gegenseitige Abhangigkeit der Zeichen be- 
riicksichtigt: 
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¢ ¢ 


Hy, (2)) =-2 Ep, (2i)-p (zs) Id pz, (zi) 
im 1. je] 


Die Entropie, die wir ohne Riicksicht auf die kontextuellen 
Zusammenhange bestimmten, ist immer gr6éBer als Hz, (z;). Die 
Differenz R, die sogenannte Informationsrate, zwischen den beiden 
GréBen 

R = H(z) — Hy, (23) 


miBt demnach die Information, die im Durchschnitt ein Zeichen 
des Textes iiber sein nachfolgendes mit sich fihrt. 

Die Informationsrate hat noch eine weitere Bedeutung. Wir 
erinnern an die Tatsache, da8 der Ubertragungskanal innerhalb 


der Kommunikationskette am leichtesten gestért werden kann. In © 


der Praxis muf immer mit einem Defekt, einer Verstiimmelung 
oder einem Verdecktwerden der Nachricht gerechnet werden. Zur 
geeigneten Beschreibung der Nachrichteniibertragung in einem 
gestorten Kanal greifen wir aus dem ZeichenfluB ein Zeichen 
heraus und verfolgen seinen Weg vom Sender zum Empfanger. 
Das gesendete Zeichen nennen wir z;, das empfangene zi*. 

Bei ungestorter Ubertragung gilt natiirlich z; = z;*. Da eine 
Stérung verhindert, daB ein z;* als zj erkannt wird, gilt bei ge- 
stortem Kanal andererseits z; 4 zi*. Betrachten wir die zeitliche 
Aufeinanderfolge von z; und z;*, dann kénnen wir den Grad der 
Stérung durch die Ubergangswahrscheinlichkeiten pz, (zi*) be- 
schreiben. Die Informationsrate erfaBt daher die mittlere distink- 
tive Information, die von dem Kanal bewaltigt werden kann. Wir 
haben also in diesem Falle 


R = H (zi*) soe Hz; (zi*). 


Unter der Kapazitat eines Kanals versteht man die distinktive 
Information, die er in der Zeiteinheit (Bit/sec) zu tibermitteln ver- 
mag. Der Unterschied zwischen der Informationsrate und der 
Kanalkapazitat besteht darin, daB jene aus einer konkreten Analyse 
gewonnen wird und demnach die materiellen Eigenschaften des 
Kanals und der Zeichenkérper impliziert, wahrend die Kapazitat 
abstrakt am Modell gemessen wird. Besonders stark ist die In- 
formationsrate von der Redundanz des diakritischen Systems ab- 
hangig, und zwar ist R um so gréBer, je redundanter das System 
ist; bei Stérungen wird ein Nachrichtentext verstaindlicher, wenn 
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man dem diakritischen System eine gr6Bere Redundanz gibt. Ein 
schones Beispiel hierfiir sind wieder die Verhaltnisse bei den natiir- 
lichen Sprachen. Man hat festgestellt, da8 in den akustischen 
Signalen etwa 50000 Bit distinktiver Information pro Sekunde 
iibermittelt werden. Das Gehor kann aber nur etwa 10000 Bit pro 
Sekunde! aufnehmen. Tatsachlich flieBen im Sprachschall nur un- 
gefahr 50 Bit Information pro Sekunde, die zu linguistischen 
Zwecken gebraucht wird. Die groBe Redundanz, die sich in diesen 
Zahlen ausdriickt, macht die Sprachen in so hohem MaBe immun 
gegen duBere Stérungen. 

Die Informationsrate kann die Kanalkapazitat nie iibersteigen. 
Es gilt der auBerordentlich wichtige Satz, daB eine solche Ab- 
anderung des diakritischen Kontrastsystems immer gefunden wer- 
den kann — eine neue Kodierung der Zeichen -, welche die In- 
formationsrate R der Kanalkapazitat C angleicht. Umgekehrt gilt 
aber auch, da die Kapazitat das Maximum der Informationsraten 
darstellt, wenn man alle méglichen Umkodierungen in Betracht 


zieht: Rmax = C 


Kusammenfassung 


Die Informationstheorie beschaftigt sich weder mit der ma- 
teriellen Struktur der Zeichenkérper noch mit der Hierarchie der 
Bedeutungen; sie konzentriert sich vielmehr auf die Sachverhalte, 
die in der Verkniipfung beider Seiten gestiftet werden, und zwar 
gewinnt sie ihre zentralen Begriffe aus einem abstrakten Schema 
dieses Zusammenhanges; sie untersucht die distinktiven Relationen, 
die sich an und zwischen den Zeichenkérpern ausprégen, wobei 
prinzipiell ein Ziel darin besteht, fiir diese dem Substrat von auBen 
auferlegten Beziehungen MaBe (d. h. Mafizahlen) herzuleiten. We- 
gen ihres abstrakten Aufbaus ist es der Theorie auch mdglich, 
Elementmengen ohne Zeichencharakter zu analysieren. Die resul- 
tierenden Mafe implizieren keinerlei Eigenschaften der Elemente; 
daher bedarf jede Anwendung der Informationstheorie einer sach- 
gerechten Interpretation von seiten der zustandigen Wissenschaft. 
Da sich die Theorie nur mit einer abstrakten Strukturanalyse 
beschéftigt, kann sie von sich aus kein Urteil tiber die Natur des 
betrachteten Phanomens abgeben. 


1 Sieche: H. Jacobson; Information and the human ear. J. acoust. Soc. Amer. 23: 
463-471 (1951). 
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Summary 


This paper gives an introduction to Information Theory with special respect to 
phonetic problems. Linguistic phenomena can be divided prima facie into two spheres: 
the content or meaning level and the substance or sound-matter. Corresponding to this 
distinction we are faced in sign-theory with the two constituents designatum and 
designans (sign-vehicle). We discern accordingly two concepts of information: 1. in- 
formation in the common sense of the word, i.e. the content of language, and 2. the 
sound features or the flow of speech necessary to identify the sign-vehicles and to evoke 
the purport meant by the speaker in the brain of the hearer. Only the latter one is the 
subject of Information Theory. 

Keeping in view the phonetic aspect, this article deals with the following main 
concepts and measurements of Information Theory: information volume, entropy, 
redundancy, information rate, and channel capacity. Omitting a detailed explanation 
of the mathematical background, these notions are developed by means of the well- 
known model of binary classification, whereby the statistical aspect is introduced under 
the premises that each binary step — symbolized as usual with 0 or 1 — is of equal pro- 
bability. 

Résumé 


Cet article est une introduction dans la Théorie d’Information en considération 
des problémes phonétiques. Les phénoménes linguistiques peuvent étre divisés prima 
facie dans les deux domaines suivants: la contenue dans la sphere de la signification 
et le courent sonore. Dans la théorie de signe les deux constituents «designatum» et 
«designans»> correspondent 4 cette distinction. Conformément il y a deux concepts de 
Vinformation: 1° Pinformation dans le sense commun, c’est la contenue de la parole, 
et 2° la configuration du son qui permet de reconnaitre les traits signifiants et de sus- 
citer le sense linguistique chez l’auditeur. La Théorie d’Information ne s’occupe que de 
ce dernier aspect. 

Toujours en vue des problémes phonétiques cette communication traite des 
notions et des mesures principales de la Théorie d’Information: le volume de l’informa- 
tion, l’entropie, la rédondance, la quote-part de l’information et la capacité de canal. 
Omettant les détails de la base mathématique ces concepts sont développés a l’aide du 
model de la classification binaire. L’aspect statistique est introduit sous la condition que 
chaque démarche binaire — symbolisées par «0» ou «1» comme d’habitude — se réalise 
d’une probabilité égale. 
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Information Points in Intonation 


By Leer S. Hurtzén, Edinburgh 


This is a small testing of one part of a theory of intonation by 
application to a set of attested utterances exemplifying what is 
known as the falling-rising pattern in English1. It is the method of 
getting at interpretations rather than the interpretations themselves 
which is in question. The plan is to make a distinction between the 
tunes one has to play and the tricks one can play on the tunes, and 
to bring the tricks under a general rule. Much of the operation on 
examples is in terms of reconstructing plausible contexts, but only 
because the actual contexts are not supplied; in an ideal operation 
one would insist upon a complete material and linguistic context 
as necessary for any interpretation. 

The information point of the title is named after information 
in the mathematical theory of communication, but I shall draw no 
further upon that theory*. There is an information point in a 
message wherever the speaker has freedom of choice in what he 
says, where it cannot be predicted what he will say. This is not, of 
course, freedom of choice in respect to some sort of truth; the 
limitation upon freedom, the basis of prediction, is theoretically in 
the antecedent linguistic structure. If only one item can occur, 
there is no information. If the probability of one of the choices is 
very high, there is very little information. There is more and more 
information as the number of possibilities increases and as the 


1 What is presented here is substantially equivalent to a paper read at the Linguistic 
Conference, Hull, May 1959. 

A rough sketch of the theory underlying the assumptions made here appears in 
Study of sounds, 1957. 

2 General discussions in Cherry, pp. 167 ff.; Herdan, pp. 162-167; Shannon and Wea- 
ver, pp. 3 ff., 99 ff. 
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choices become more nearly equiprobable*. According to the strict 
definition in information theory, it is only the number of possible 
choices at any point and their probabilities upon which the amount 
of information is to be calculated; the choice actually made is 
impertinent at that point. While I shall later say something about 
the choice made, this definition is sufficient for the general applica- 
tion to the problem of intonation to which I now turn. 

In every utterance, a man has to do certain things intonation- 
wise because he speaks a particular language or dialect with a 
particular accent and is the man he is, in the mood he happens to 
be in at the moment. The communication in this part of the tune, 
if the hearer can interpret, is that and nothing more. I assume that 
this formal pattern for a speaker of RP English is typically, as it 
is frequently said to be, a descending series of accented or stressed 
syllables, with unaccented or unstressed syllables interspersed in 
one way or another. This part of the tune is what I do not wish 
to consider here. I especially want to avoid attention to the overplay 
of mood or emotion, whether continually characteristic of the 
speaker or only at the moment in question. 

There is superimposed upon the formal pattern a syntactical 
signalling pattern which all writers on RP note as an end rise or 
fall, but which I am sure for American English and begin to be 
sure for much English English, whether or not for RP, is rather a 
not-low versus low. The commonality of opinion as to the commu- 
nication here is noncompletion versus completion. 

Granted that every English intonational unit must be uttered 
by an individual speaker of English in a situation of noncompletion 
or completion, we may take the two compositions of formal and 


3 It may be noted briefly that information theorists find it advantageous to take 
as a unit the operation required to specify one of two equiprobable choices. This unit, 
called a bit (binary digit) is mathematically the logarithm to the base 2 of 2 (choices), 
shown as log, 2 = 1. Where the choices are equiprobable, the general statement is that 
the number of bits necessary to specify a choice is log, n, where n is the number of 
choices. Thus if there is only one choice, log, 1 = 0 and there is no information; four 
choices, log, 4 = 2, two bits of information; eight choices, log, 8 = 3, three bits. For 
certain purposes one may calculate in fractions of bits, e.g. for five choices, log, 5 =2.322. 
Where the choices are not equiprobable, the amount of information is always less. Thus 
with two choices, one .9 probable and the other .1 probable, the average amount of 
information, calculated by a somewhat more elaborate formula, is .469 rather than 
1 bit; with eight choices, one of which is chosen 75% of the time and the other seven 
equiprobable but altogether chosen only 25% of the time, the number of bits is approxi- 
mately 1% rather than 3 — if one choice is .93 probable and seven .01 probable, the 
number is only .562. 
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syntactical patterns to constitute the “‘two fundamental tunes’ 
(Jones) to which “English intonation can be reduced’’ (Armstrong 
and Ward)*. For the tune as a whole there is one possibility of 
choice, that between the two tunes, and so one information point 
for examination. 

It is convenient to consider separately for any example the 
intonation and the utterance minus intonation, roughly what can 
be represented orthographically, what I am calling the text. If 
there were communication in the tunes quite independent of com- 
munication in the text, as any theory of special meaning in tunes 
has to assume, there might always be free choice of tune. But there 
is regularly in the text shape the same syntactic communication as 
that already noted for the basic tune, i.e., the text shape indicates 
noncompletion or completion. Where the text is in completion 
shape, Tune I fits; and if it occurs one doesn’t write papers about it. 
If the same text shape turns up with a rising or not-low end, the 
intonation need not be identified as a regular Tune IJ; it can better 
be looked upon as a Tune I on which a trick has been played, for 
which the less probable choice has been made at tune end. That 
is, there is a discrepancy between text shape and intonation shape. 
The overriding interpretation would be: Some qualification is to 
be made regarding the whole utterance covered by this tune. Such 
a single interpretation has three advantages over the multiple 
interpretations so frequently met with. It is simple rather than 
complex. It gets rid of the notion that continuation has to be 
supplied by something that isn’t there. It can be stated in colorless 
terms, without that emotion-arousing word, implication. 

The application to type cases does not always yield a single, 
and consequently pleasing, answer. When the text shape is a 
command and commands can be thought of as harsh, the only 
qualification that can be made is less harshness, frequently called 
mollification. When the text is in the shape of a plain statement of 
fact, however, the nature of the qualification is not specified by the 
alteration in the end turn. One qualification of a statement is 
questioning rather than asserting; another is uncertainty rather 
than certainty; another is the nondidactic tone rather than the 
didactic — the list is incomplete. The choice among these possible 
qualifications will be fixed by the total context rather than by 


4 Fones, § 1019; Armstrong and Ward, p. 4. 
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subtleties in the shape of the intonation. If the total context does 
not force a choice, there is ambiguity, which may or may not be 
of any importance. 

Our principal concern, however, is with specific information 
points in the text. Let us put aside for the moment the differen- 
tiation between the two tunes and start again from the common 
formal pattern, in which there is by definition no immediately 
pertinent information. If all English utterances flow along in such 
a melody without regard for idea content, it seems reasonable to 
think that what the content can do is to play tricks on the tune 
pattern to call attention to itself. Or put it the other way around, 
any trick played on the tune will call attention to what is in the 
text at that point. The principle of signalling is simple: just as at 


tune end a not-low or low signals noncompletion or completion — 


as a green or red traffic light at a main road crossing signals go or 
stop — so a modification of the formal pattern in contrast to no 
modification signals attention to what’s there — as a sign along the 
road in contrast to no sign signals whatever the design of the sign 
signifies. There may be a formal shape for the attention calling 
modification of the tune, more or less fixed for the language, etc., 
but probably any old trick will do about as well as any other. 

It is not quite true to say that there is no attention-calling in 
the basic tune. The first and last accent positions are comparatively 
conspicuous, partly as first and last and partly for the high-pitch 
loudness of the first and the intonational turn of the last. Unmodified 
Tune I or Tune II may be said to provide for two information 
points and the common English subject-predicate structure in its 
simplest form may be expected to provide two information points 
in the text of an intonational unit. But it is not so that most texts 
are simple subject-predicate structures and also not so that both 
subject and predicate always provide information points. The lack 
of information in the subject shows up in the extreme case where 
completely predictable pronouns appear and in the predicate where 
only auxiliary or substitute verbs appear. There are also the cases 
in which the information point in a long subject or predicate is not 
in the first or last theoretically accented word. By and large, most 
texts contain predictable and informing items in a ordering which 
the basic tunes do not provide for. 

As to what is predictable, it has been calculated on a purely 
mathematico-linguistic basis that English is about fifty percent 
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redundant, half controlled by the statistical structure of the lan- 
guage and half a matter of choice®. This calculation is based on 
literal structure and takes account of about eight letters. For our 
purpose we should probably better think of morpheme or word 
structure and should also, I am sure, take account of a much larger 
linguistic, and also the nonlinguistic, context. Mr. Trim puts the 
case nicely with his frame ““There’s a — in your —’’, the blanks re- 
presenting “the real points of choice”’*. He notes that fly at the 
first point makes soup more likely at the second, and that both are 
more likely in a restaurant as against /adder and stocking in the street. 

My less romantic example is the second-order restraint of The 
and the fourth- or fifth-order restraint of I bought the. Taking into 
account only the linguistic structure, an enormous number of items 
may follow The and only a comparatively small number may 
follow I bought the. The possible items in the latter case can be listed 
and probabilities calculated without recourse to meaning; at least 
theoretically one can find out what actually does follow I bought the 
in an adequate corpus and how often. We can go further in an 
actual situation, where it must be expected that the hearers are 
pretty well familiar with what J might have bought; the list of 
possible next items is greatly reduced and so the information much 
less than that calculable for the purely linguistic context. One can 
even imagine a situation in which what might have been bought 
is absolutely predictable, i.e. has a probability of 1.0, and the utter- 
ance must take some such form as J “bought the damned thing, with no 
information in the last two words. 

In this context there is one information point in the text, where 
the choice is among bought, found, inherited, stole, etc. In other con- 
texts the same text might have one information point where J 
occurs or damned, or two information points, where bought and 
damned occur, or I and bought, or possibly J and thing. It would be 
difficult to account for more than two information points because 
at least something in the text must be predictable in any conceivable 
context. 

The tentative theory that some aspects of intonation can be 
explained as marking information points must, of course, be proved 
by utterances attested in one way or another. The fundamental 


5 Shannon and Weaver, pp. 25-26, 104. 
6 Fohn Trim: Language and communication. The Teacher of the Deaf 56: 113 
(1958). 
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question to be addressed to any example can be phrased in either 
of two ways: 1. Does the intonation indicate an information point 
wherever there is in the text, in context, an information point? 
or 2. Is there an information point in the text wherever a specific 
modification of the basic tune, or no modification, indicates an 
information point? 

For a small test now, I take, with permission of the author, the 
numbered examples in a recent publication, Alan E. Sharp’s ‘‘Fall- 
ing-Rising Intonation Patterns in English’’’. I think one can cover 
the rise part of the intonation in almost all cases as a qualification 
of the statement, request, etc. in the form in which it appears. In 
the first example, for instance, if there is no qualification of the 
statement, the form is more likely to be I ‘thought so. The fall part 


of the falling-rising intonation is exactly the kind of trick which . 


marks an information point, one of the most frequently used mo- 
difications of the basic tune. The fall may occur at any accent 
position in the basic tune or, less frequently, at an unaccent po- 
sition, e.g. where the choice is between zs and is not or between 
is and was®, 

If both fall and rise in an example focus upon the same syllable, 
Sharp’s FR, it must be inferred that the intonation marks only one 
information point. If the fall is on one syllable and the rise on 
another, Sharp’s F + R, the intonation may be expected to mark two 
information points, one where the fall occurs and one where the 
rise, with end-of-unit conspicuousness, occurs®. We may ask the 
fundamental question in its second form, i.e. examine the text, with 
such reconstruction of context as may be possible, to discover 
whether or not there are information points where the intonation 
marks them. In accord with the definition in information theory, 
it is to be assumed that there is no or practically no information 
if the item which appears was predictable or highly probable; that 
there is information if the item represents a choice where choice 


* Sharp, pp. 141-144. The phonetic shape of the intonation is fully described by 
Sharp, pp. 130-133. 

8 Allowance has to be made for the possibility of a fall that is only an intensifying 
part of the pattern identified as qualifying end rise. This intensification-reversal may 
account for some of the Tune III’s which Kingdon says (Groundwork, p. 84) make up 
thirty percent of the tunes in British conversation. 

® In the theory F+R cannot be looked upon as division of a unity, as Kingdon 
explicitly calls it (Practice, pp. 8-9; Groundwork, p. 10). It is rather that FR is the 
coincidence of two signals. 
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was possible, i.e. if the speaker, or some other speaker, with the 
same material and conversational background, might have said 
something different from what he did say. 

The examples are shown with Sharp’s interpretation in full. My 
own comment, except where I supplement the general discussion, 
is merely attention directing. If the examples are not obviously 
exemplary, no argument will improve them. 


1. I ‘thought “so (you have confirmed what I thought). 
2. I “thought so [(i) but have since been proved wrong; 
(ii) but your words have made me doubtful]. 


For 1 the word what in the gloss confirms the second informa- 
tion point. As to the information in thought, it is enough for the 
moment to note the choice between think and thought. For 2 the so 
must have been taken care of in the antecedent context; there is 
no choice as to this way or that way, one what or another. The 
two so different possible glosses bear witness that the intonation 
does not specify meaning, but this point can be labored later. 


3. I “think so (but may be wrong). It is interesting to note that J ‘think ‘so is a 
most unlikely utterance, and would have to mean something like, “‘Such 
is the way my ratiocinatory processes operate’’. 


This is similar to 2 except as the gloss exposes another line of 
choice for think, perhaps adequately defined as in the range sure — 
not sure. Sharp’s note exposes one of the hazards of exemplification: 
to me his rejected tune is fully as acceptable as the similar no. 1. 


4. He “wants to (but can’t). N.B. He ‘wants “to is impossible. 


The gloss and note point out the limitation to one information 
point. F +R is impossible because wants to is a single item, similar 
to wants alone in 5 and 6. 


5. He ‘wants ‘two (so he can’t throw them all away). 
6. He “wants two (but can’t affort them). 


Both points of information are noted in the gloss on 5, an 
alternative of which would be: “‘He’d not be satisfied with one.” 
I do not suggest that this gloss is better than Sharp’s; it merely 
orders the choice-showing items as in the text. Sharp makes it clear 
that all his explanations are to be taken as examples only, not as 
the only possible interpretations. 

The wording of the gloss on 6, with the nonselective them, 


9 Phonetica, Vol. 4, No. 2/3, 1959 
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suggests no information in two, which must have been specified in 
the context. 
7. He ‘shot himself [(i) his wife he poisoned; (ii) his own hobby was shooting]. 


8. He “shot himself [(i) but did not die of the wound; (ii) you’re wrong in saying 
that he cut his wrists]. 


No. 7 offers a good place for a further note on information. 
The first gloss specifies for both items what is often said to be a 
contrast, with the contrasting term unexpressed in the utterance 
but necessarily expressed in the gloss. This is an alternative way of 
saying that there is information where there is choice and goes one 
step further by noting that selection of one choice rules out the 
others. Some recent writers dealing with information theory have 
assigned a quantitative value to the choice made at any point such 
as to say that the less probable the chosen item the greater the 
amount of information, or have less precisely noted that “the 
amount of information depends upon the number of things that 
could have happened but didn’t’’ 2°. What is noted as contrast is only 
awareness in the hearer of one of the rejected choices. Whether or 
not the same contrast was in the mind of the informant cannot be 
discovered without context except when the item is one member 
of an unquestionable dichotomy and consequently only two choices 
are possible. 

The two glosses on 7 taken together not only testify to non- 
specifying in the intonation, but also, because they so obviously 
indicate different ranges of information, point up a role of context 
different from that of restraint on item probability. Context may 
specify a range of choices, in this case either ways of destroying, 
shooting being one, or sports, shooting being one. It is inconceivable 
that in a total context there should be any question as to which 
gloss applies here. 

There is a possibility of a third gloss for 7, but a simpler 
example is one furnished by Lee. He has more than a dozen tunes 
for She won’t consult one doctor, for which he has two summary inter- 
pretations: no doctor will be consulted, and one will not be enough". 
Note, however, that one lies in.at least three ranges of information 


10 The quantitative statement, Peterson, p. 178, is that the information conveyed 
by a symbol is to be measured by the logarithm of the reciprocal of its probability, and 


of course the smaller the probability the greater its reciprocal. The more general 
statement Miller, p. 41. 


A Een pasos 
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that might fit into this text, the third to be glossed: There is one 
doctor she will not consult. The FR on one will not by itself select 
among one versus none, one versus more than one, and one parti- 
cular versus others. In general the intonation will not specify the 
context for an isolated text. 

In 8 the limitation to one point of information is clear-cut. 
It is to be noticed that the first gloss, which is possible only because 
being shot is so often fatal, is bound to be supplied in the context, 
either in words or in knowledge by the hearer that the man did not 
die. 


9. “I can do ‘that (so there’s no need for you to boast). 


The gloss here does not cover that. It could be extended in the 
same tenor: ‘‘No need for you to boast about blowing smoke rings, 
although you might about something else.”’ 

10° “I can (you have just said that you can’t). 

11. ‘I “can (unenthusiastic admission of ability in response to, for instance, ‘‘Who 

plays bridge?’’). 

The one point in 10 is obvious. In 11 there is of course no 
certainty of unenthusiasm or of any emotion. It may be that J, 
of those present, can, rather than will. 


12. “He’s a ‘plumber (ask him how to mend the tap). 
13. “He’s a plumber (the other man isn’t). 


For 12 the term plumber has presumably not yet come into the 
conversation although the tap has. For 13 either plumber or some- 
thing very close to it must have been mentioned. 


14. He’s a ‘queer ‘chap (as chaps go, he’s queer). 
15. He’s a “queer chap [(i) So look out!; (ii) but really very nice]. 


I am most uncertain of the gloss on chap for 14, perhaps because 
chap is for me a most vague, nonspecifying and so noninforming, 
word. It may be that there is an English class, chaps, to be distin- 
guished from nonchaps. Or it may be possible that fall-rises are 
often nonselectively distributed over an information-bearing word, 
perhaps only if monosyllabic, and a following neutral word at 
utterance end. If so, 14 would be the same as 15. I would guess that 
the first gloss here for 15 is more on the rise, the utterance as a 
whole; the second more on the information point. 


16. She gave me the ‘sweetest “smile (Some sort of smile was, perhaps, to be 
expected: hers was exceptionally sweet). 
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Note that, according to the gloss, the smile was expected by, 
predictable for, the speaker only; there is information in the 
message intended for a hearer. 


17. “Eat well (warning: or you’ll soon be exhausted). 
18. ‘Eat “well (entreaty: there’s a good boy!). 


18 should be much more probable than 17, there being normally 
information, alternative choices, for both words. 17 is possible only 
if the amount of energy available has to be distributed among 
eating, exercising, keeping warm, etc., any of them to be well done. 

19. ‘Do ‘smoke (make yourself at home. I know you like smoking). 

20. “Do smoke (e.g. A to B: ‘Don’t ‘smoke. C to B: “Do smoke, i.e. ignore A’s 

plea). 

The glosses clearly specify two information points for 19 and 
one, with smoke predictable, for 20. 


21. ‘Be an ‘angel (please). 


The gloss is on the rise. The linguistic shape is that of a com- 
mand, but the text makes unqualified command impossible, unless 
for a dramatics coach. The two information points are obvious, 
even if one might say that only synonyms of angel are likely after Be, 
as antonyms after Don’t be. 

Note on nos. 22-26: I am still inclined to accept Coleman’s 
conclusion that the rise for general questions in this text shape is non- 
completion, not because of the rise, but because the text shape is 
also noncompletion. 

22. Are “all your family clever? (You obviously are). 

23. Have we “got any coffee? (It’s all very well talking about making -coffee, 


but...). 
24, Have you “much luggage? (A little can easily be conveyed). 


The glosses specify one information point each, with clever, 
coffee, and luggage necessarily predictable from the context, whether 
or not preoccurring in those words. Family in 22 is not information 
bearing; it is merely the name of the range in which you belongs; 
Are you all clever? would have the same FR on ail. 


25. “Are you ‘coming? (Despair: Must I wait here for ever?). 
26. ‘Will you sit “down? (Pleading or impatient according to voice quality, tempo, 
etc.). 
The fall may well be an intensification for the whole utterance, 
not an information marker, and I think must be so taken to fit in 
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with the glosses. Schubiger speaks of utterances like these as having 
an emotional shift of the nuclear glide to a word which in less 
emotional speech would be nonnuclear or even unaccented!*, If 
there is information at the fall point, the glosses would have to 
include ‘Are you or aren’t you” and “Will you or won’t you’’; 
perhaps this is a better interpretation. Cf. no. 30 below for another 
explanation. A 


27. ‘What shall I ‘tell him? (I really cannot think of anything). 
28. ‘How do you like your ‘coffee? (Intimacy). 


These are testing utterances. The first information point, in 
the choice among interrogatives, has been attested for some cen- 
turies1°, Ordinarily the prominence of high pitch at beginning of 
the intonational unit is adequate for the pointing; here the fall is 
intensification, and whether of the information point or of the 
whole utterance it would be difficult to say. But at the second tune- 
marked point fell and coffee must be fixed in their respective ante- 
cedent or simultaneous contexts, verbally or materially, and there 
would not seem to be possible choices. Two explanations suggest 
themselves. Both utterances may be taken as echoes of similar texts 
where there was information, tell or act, etc., and coffee or tea, etc. 
Or the rise may be no more than whole utterance qualification, 
with full accent in teld and coffee because of the distance from What 
and How. Compare no. 28 with no. 23. 


29. “What’s his name? [(i) I have forgotten; (ii) I am incredulous]. 


Under the circumstances implied in the glosses, name is pre- 
dictable; if the utterance follows immediately upon the first naming, 
as possible for the second gloss, “What would do by itself. Or perhaps 
repetitions like this are better taken as intensified-qualified whole 
utterances with no specific information points. 


30. When “is he coming? (Several possible dates have already been rejected). 


This readily recognizable utterance fits in even more neatly 
than 25 and 26 with Schubiger’s emotional shift of the nuclear glide 
to a normally unaccented syllable. The most likely informing items, 
When and coming, are surely predictable, and is in the range is — 
is not hardly fits. One might suggest zs in a range difficult to ver- 


12 Schubiger, p. 107. 
18 Charles Butler: English Grammar (Oxford 1633), p. 61. 
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balize, something like zs fact — is problematical, as representing 
choice where the tune points to information, if it does. 


31. How’s the “family? (The remainder of this conversation was not heard, but 
may have included a previous inquiry about the health of the person 
addressed). 


This is a perfect example. The gloss takes care of the predict- 
ability of How and confirms the range of the one information point. 


32. Thank you ‘so “much. 

33. “So much? (Is “this the quantity you require?). 

These are good examples. In 32 much is a choice and so a 
selection of quantity, even if it must be admitted that everything 
is highly predictable. It is one of those formulas that reflect an 
informing situation no longer actualized. In 33 so is in the material 
context a specific in a range of more and less, and much is pre- 
dictable, the word that has to come after this so if anything does. 


34. He went “home, of course (but that’s as far as he got). 
35. He went ‘home, of “course (how stupid of you to ask me where he went!). 


The one point in 34 is specified in the gloss; the of course is 
hardly needed in the text any more than it is in the tune. In 35 the 
of course seems to be a late added qualification rather than a quali- 
fication within the tune. If the last turn is reversed, i.e. without 
what is here glossed as stupidity, the turns on home and course 
will both be full falling suggesting that we have two tunes rather 
than one. 


36. “Good old ‘Joe! 


The whole-tune qualifier on Joe may be merely rhythmic. In 
most American English the o/d would, I’m sure, have accent, with 
a diphthongized vowel rather than the monophthongal vowel of 
a quite unaccented syllable, making this example, with three 
accents, unlike most of the preceding and the separation of fall and 
rise more likely. American or English, it may not be stretching the 
theory too thin to suggest that. information clings to any personal 
name in anything said about that person, no matter how much the 
name is repeated; if it is felt that there is no information, a pronoun 
is used. The alternative low-ending tune for this text would have, 
I think even in English English and at his funeral, a terminal fall 
on Joe as well as a pointing on Good. 
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37. “All ‘right (Resignation). 


This is, like 32, a formula for a situation and reflects the two 
information points it would have if there were any information 
in it. 

38. You’ve “seen him, haven’t you? (Reassure me). 

39. You’ve ‘seen him, ‘haven’t you? (Confirm). 


You've —, haven’t you? is a standard frame in English, along 
with You haven't —, have you? and regularly has one blank, room for 
one information point, as in 38. If the frame is the same in 39, the 
second information point, indicated by an accented form-word, is 
in the frame rather than in the blank. The interpretation, pretty 
well fixed here because alternatives are wanting, might be phrased 
as less assurance of the answer the frame anticipates, calling for 
more information in the popular sense. The difference between 38 
and 39 would be only a difference in degree, but degree, or pro- 
bability, is just what we are talking about. It is possible, however, 
that we have in 39 two separate tunes; Aave you will fit after the 
comma here as it will not fit in the standard frame. 

40. Hm! A “gloomy place! (Whatever its virtues may be). 

41. Hm! A ‘gloomy ‘place! (As places “go, its ‘gloomy). 

The gloss on 40 nicely specifies the range of the single informa- 
tion point without specifying contrast. I do not understand 41 as 
other than a distributed variant of 40, because for me place has 
no specificity and follows a gloomy with a probability of something 
like .9. 


Summary 


It is possible that we have been expecting a great deal more of 
intonation than we are justified in expecting. The signalling device 
may be very simple and nonspecifying. Whatever is specific in the 
interpretation may be got more from the text in its material and 
linguistic context than from the refined shape of the intonation. 
The tie-up with the concept of information in the mathematical 
theory of communication may help to emphasize the role of in- 
tonation in pointing to where the choices are rather than in specify- 
ing what the choice is. The testing by this set of examples, originally 
chosen for some other purpose, does not of course exhaust the 
possibility of testing the correlation of intonation signs with infor- 
mation points in a message. 
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Kusammenfassung 


Die Anwendung des mathematischen Informationsbegriffs auf das Problem der 
Intonation sollte demonstrieren, daB die Rolle der Intonation weniger in der Spezifizie- 
rung der Art einer freien «Wahl» (im Sinn der Informationstheorie) als im Hinweis auf 
die Stelle der Wahl bestehen diirfte. Die spezifische Interpretation einer sprachlichen 
AuBerung hangt wahrscheinlich in erster Linie von ihrem situativen und sprachlichen 
Kontext ab. 

Mit den gegebenen Beispielen, die an sich fiir eine andere Fragestellung ausgewahlt 
wurden, sind natiirlich nicht die Méglichkeiten erschépft, den Zusammenhang zwischen 
Intonationszeichen und Informationspunkten von Nachrichten zu untersuchen. 


Résumé 


En appliquant le concept mathématique d’information au probléme d’intonation 
auteur se propose la démonstration que l’intonation ait la fonction de marquer la place 
d’un «choix» (dans le sens de la Théorie d’Information) plut6t que de définir le carac- 
tére du choix. Probablement l’interprétation spécifique d’un message dépend princi- 
palement de son contexte situatif et linguistique. 

Il y a naturellement encore des autres possibilités d’examiner la relation entre les 
signes d’intonation et les points d’information que les exemples donnés, choisis originaire- 
ment pour servir a une certaine tache différente. 
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Die Ausdruckstheorie der Sprechstimme 
(Literatur seit 1945) 


Von Fetrx Trojan, Wien 


1. Die Stellung der Ausdruckstheorie der Sprechstimme innerhalb der 
allgemeinen Ausdruckslehre 


In der allgemeinen Ausdruckslehre der Gegenwart macht sich 
eine entschiedene Tendenz geltend, sich von der Physiologie als 
einer streng naturwissenschaftlich verfahrenden Disziplin und einer 
auf ihr als Voraussetzung aufbauenden Psychologie abzuwenden 
und Gesichtspunkte einzunehmen, die nicht von vornherein durch 
das Leib-Seele-Problem belastet sind. Als zwei typische Werke 
seien genannt: F. 7. 7. Buytendijks «Allgemeine Theorie der mensch- 
lichen Haltung und Bewegung» (eine Theorie, die auch die Pro- 
blematik der Ausdrucksbewegung umschlieBt) und — in einem ge- 
wissen Abstand davon zu nennen — R. Kirchhoffs «Allgemeine Aus- 
druckslehre». Kirchhoff, ein Schiiler 7. Ruderts, will diese Disziplin 
phanomenologisch und zugleich ganzheitstheoretisch ausrichten. 
Er geht von dem Ursachverhalt des Inderweltseins aus und ge- 
langt von hier aus zu zwei einander erganzenden Satzen: der eine 
besagt die Universalitat des Erscheinens, der andere die wechselnde 
« Positionalitat» des Lebendigen. Diese letztere wird ihrerseits 
wieder durch die Relation zwischen dem Sender und dem Empfan- 
ger des Ausdrucks naher bestimmt, eine Beziehung, die sowohl 
unter erlebnispsychologischem wie unter behavioralem Aspekt ge- 
sehen werden kann. Raéumt Kirchhoff somit auch der objektiven 
Psychologie einen Platz in seinem System ein, so zieht er auch in 
breitem Ausma8 Ergebnisse der Verhaltensforschung (Ethologie) 
heran, obwohl diese nach WN. Tinbergens grundsatzlichen Ausfiih- 
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rungen auf objektive Kausalzusammenhange und im besonderen 
auf physiologische Mechanismen eingestellt ist. De facto bemiiht 
sich indes Kirchhoff ebenso um die Ausmerzung des physiologischen 
(und physikalischen) Aspektes in der Ausdruckslehre, wie es nach 
E. Straus im Sinne der Lehre Pawlows und der gesamten objektiven 
Psychologie liegt, das Phanomenale auszumerzen. So wichtig nun 
aber auch die Erforschung der BewuBtseinserscheinungen fiir die 
Phonetik und die Lehre vom stimmlichen Ausdruck sein mag — fiir 
diese beiden Disziplinen steht der physiologisch-genetische Aspekt 
viel zu sehr im Vordergrund, als da8 er je zugunsten eines einseitig 
phanomenalen zuriickgedrangt werden kénnte. Ein gleiches gilt 
natiirlich erst recht fiir den physikalisch-akustischen Aspekt. 

Auch Buytendijk geht von dem Begriff des Inderweltseins aus. 
Aber im Gegensatz zu Kirchhoff baut er sein Modell nicht mit den 
Begriffsmitteln einer phanomenologisch orientierten Psychologie 
auf, sondern mit denen einer den Bereich einer kausalistischen 
Biologie iiberschreitenden Funktionslehre. Denn aus den BewuBt- 
seinsinhalten lassen sich die Lebensvollziige ebensowenig erklaren 
wie aus dem physikalischen Erkenntnissystem ohne oder mit Ein- 
schlu8 der Gestalttheorie. Im Mittelpunkt der Theorie Buytendijks 
steht ein wissenschaftlich formulierter, aber doch metaphysiknaher 
Subjektbegriff, dem der der Welt, des Lebensfeldes, der Situation 
gegeniibersteht. Das Subjekt ist ihm der schépferische Grund alles 
bewu8ten Geschehens wie auch aller «unbewuBbten» Phanomene 
und ihrer leiblichen AuBerungen. Mag man auch der ontologischen 
Ausdeutung des Subjektbegriffes skeptisch gegeniiberstehen, so laBt 
sich doch nicht in Abrede stellen, da8 Handlung und Ausdruck in 
ihrer Sinnhaftigkeit nur durch eine funktionell-teleologische, nicht 
eine kausalistische Denkform begriffen werden kénnen, wenngleich 
die beiden Denkformen, wie schon KX. Sapper einleuchtend gezeigt 
hat, einander keineswegs ausschlieBen. 

Selbst wenn man nicht so weit gehen mochte, die Zustandigkeit 
der Psychologie, und zwar sowohl ihres phanomenologischen wie 
ihres Verhaltensaspektes, fiir eine Grundlegung der Ausdruckslehre 
zu bestreiten, so muB doch gefordert werden, daB in einer solchen 
Grundlegung Raum fiir die Aspekte aller an den Problemen des 
Ausdrucks interessierten Disziplinen geschaffen wird, also neben 
den Gesichtspunkten der Humanpsychologie und der Ethologie 
auch fiir die der Physiologie, Biologie, Soziologie, Linguistik, Infor- 
mationstheorie und Sematologie, und daB im weiteren Umkreis auch 
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die thematisch beteiligten Kulturwissenschaften beriicksichtigt wer- 
den. Fiir die Erforschung des stimmlichen Ausdrucks kommt dazu 
noch die Akustik. Nicht durch eine einseitig phanomenologische 
Fundierung, sondern nur im Sinne eines Briickenschlages zwischen 
Natur- und Geisteswissenschaften im Bereich des stimmlichen Aus- 
drucks und der Sprache ( Trojan, 1948; C.L. Meader und F.H. Muyskens, 
1950; Kainz, 1958) und ihrer gleichmafBigen Beteiligung kann der 
Grund zu einer allgemeinen Ausdruckslehre gelegt werden. 

Es darf angenommen werden, da8 eine solche Grundlegung 
auch zur Klarung mancher noch ungeklarter Prinzipienfragen fiih- 
ren wird. Darunter finden sich gewi8 solche, die nur durch die 
Annahme einer Polaritat gelést werden kénnen, und zwar in dem 
Sinne, daB sich im Laufe der Entwicklungsgeschichte das Schwer- 
gewicht von dem einen Pol auf den anderen verschoben hat: so 
bei den Problemen, ob es sich beim Ausdruck (nach dem Wortlaut 
bei Kirchhoff) um autistische Entladung oder um Kontaktphano- 
mene, um intentionslose oder beabsichtigte AuBerungen handelt 
und ob sein Wesen kommunikativ ist oder nicht. Mit dem Ent- 
wicklungsgedanken in Zusammenhang stehen auch die Wesens- 
bestimmung der Darstellung bzw. «Uberformung» (L. Klages, 
K. Biihler, G. W. Miihle und A. Wellek) sowie die der Gestaltung, das 
Verhaltnis von Handlung und Ausdruck (Buytendijk, Kirchhoff) und 
die Frage der Anwendbarkeit des Symbolbegriffes auf den Bereich 
des tierischen Ausdrucks (K. Lorenz, O. Koenig). Dieser Bezug von 
Hauptproblemen der Ausdrucksforschung erfordert somit auch den 
Einbau des Evolutionsgedankens, dem V. FE. Negus auf dem Gebiet 
der Stimmforschung durch seine Entwicklungsgeschichte des Kehl- 
kopfes die gesicherte Grundlage gegeben hat, in das Konzept einer 
allgemeinen Ausdruckslehre. 

Nur im Rahmen eines so weitgestreckten Entwurfes kénnen 
die im folgenden zu besprechenden Ansatze zu einer Theorie des 
stimmlichen Ausdrucks ihren systematischen Platz finden. 


2. Der stimmliche Ausdruck im allgemeinen und sein Verhdltnis 
zur Sprache und zur Mimik 


Die Erforschung des normalen stimmlichen Ausdrucks kann 
entweder seine Pathognomik oder seine Physiognomik zum Gegen- 
stand haben. Aufgabe der Pathognomik ist es nach Trojan, die 
Konstanz affektiver Ablaufe im Wechsel der Individuen herauszu- 
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stellen, wahrend es die Aufgabe der Physiognomik ist, die Konstanz- 
momente der individuellen Charaktere, aber auch der Charakter- 
typen im Wechsel der Affekte darzustellen. (Uber den Konstanz- 
begriff s. u.) Zieht man auch die Variation des stimmlichen Aus- 
drucks bei verschiedenen sprachlichen Gemeinschaften in Betracht, 
so 1aBt sich die Unterscheidung von Pathognomik und Physiogno- 
mik noch mit den Gegenbegriffen «individuell» und «kollektiv» 
kreuzen. Das vorliegende Referat bespricht in den beiden folgenden 
Abschnitten zuerst die pathognomische, dann die physiognomische 
Arbeitsrichtung. Einem weiteren Abschnitt bleibt die Pathologie 
des stimmlichen Ausdrucks vorbehalten, wahrend zuletzt iiber den 
stimmlichen Ausdruck' im Rahmen einer vergleichenden Aus- 
drucksforschung berichtet wird. 

Der Eigenart aller akustisch sich auswirkenden AuBerungs- 
formen gemaB 1a8t sich sowohl die Pathognomik wie die Pysiogno- 
mik des stimmlichen Ausdrucks unter mindestens zwei methodisch 
streng voneinander zu sondernden Aspekten bearbeiten; nach der 
Terminologie von G. Panconcelli-Calzia unter dem genetischen (oder 
anatomisch-physiologischen) und dem gennematischen (oder phy- 
sikalisch-akustischen). Fiir den genetischen Aspekt gliedert sich die 
Gesamtschau in einzelne Organregionen auf, wobei natiirlich (im 
Gegensatz zu der alteren peripher ausgerichteten Phonetik) dem 
Zentralnervensystem und seinen Erregungsablaufen der gebithrende 
Platz anzuweisen ist. Demgegeniiber scheiden sich im gennemati- 
schen Aspekt die akustischen Dimensionen der Tonhohe, Tonstarke, 
Klangfarbe und Tondauer. 

Nach den soeben entwickelten Begriffen wurde denn auch tat- 
sichlich schon versucht, Uberblicke tiber das der Erforschung des 
stimmlichen Ausdrucks gewidmete Schrifttum zu geben. So hat 
O. v. Essen in einem Beitrag zur Diisseldorfer Tagung der Deutschen 
Gesellschaft fiir Sprach- und Stimmheilkunde gezeigt, daB die 
« Psychophonetik» sowohl von der physiologisch-genetischen wie 
von physikalisch-gennematischer Seite angegangen wurde. Dem- 
gegeniiber gliedert L. Kaiser in ihrem Beitrag «Zur Anwendung der 
Phonetik in der Psychologie» in der Festschrift fiir F. Kainz das von 
ihr zusammengestellte reichhaltige Literaturmaterial nach den 
jeweils im Vordergrund stehenden akustischen Dimensionen (Ton- 
hohe, Intensitat, Dauer und Klangfarbe). 

Fir den physiognomischen Forschungsbereich gewinnt, wie 
F. Trojan 1953 gezeigt hat, neben dem genetischen und dem genne- 
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matischen noch ein dritter Aspekt Bedeutung, der nach einem von 
A. Sotavalta gepragten Ausdruck als «ergematischer» bezeichnet 
werden kann. Hier geht es um die Wirkung einer individuellen 
(oder ihr nachgebildeten) Stimmgebung auf den Horer, die da- 
durch in ihm bewirkten BewuBtseinsgegebenheiten und insbeson- 
dere um die im Zusammenhang damit auslésbaren motorischen 
Reaktionen. Durch die Beriicksichtigung dieses Aspektes 1a4Bt sich 
das in den Typologien von 7. und O. Rutz und G. Becking sowie durch 
die Schallanalyse von E. Sievers* bearbeitete Gebiet in die stimm- 
physiognomische Forschung einbeziehen. 

Nicht nach den soeben aufgewiesenen Forschungsbereichen und 
Aspekten, sondern nach den Bedingungen, denen jeglicher Sprech- 
akt unterworfen ist, beschreibt endlich A. de Lacerda die « Facteurs 
de la variation élocutive». Er formuliert sie in fiinf Fragen: Wer 
spricht? Wovon spricht man? Zu wem, warum (wozu) und wo 
spricht man? In diesem Rahmen, der an die Modelle KX. Biihlers und 
A. H. Gardiners erinnert, finden dann die Probleme der Pathogno- 
mik und der Physiognomik, der Genesis und der Gennematik ihren 
Platz. Was de Lacerda bietet, ist freilich weniger ein Bericht iiber die 
bisherige Stimmforschung, als ein groBziigiges Arbeitsprogramm. 

Was nun das Verhiltnis des stimmlichen Ausdrucks zur Spra- 
che bzw. zum Sprechakt betrifft, so herrscht im allgemeinen die 
Uberzeugung, daB stimmlicher (und artikulatorischer) Ausdruck 
und Sprechen (als Realisation sprachlicher Normen) zwei grund- 
satzlich zu trennende, wenngleich vielfach voneinander abhangige 
und in Fusionseinheit miteinander wirkende Funktionsgruppen 
sind. Die Abgrenzung ist freilich zum Teil kontrovers. So hat etwa 
H.C. J. Duijker 1946 in einer Auseinandersetzung mit A. H. Gar- 
diner, A. Reichling und A. W. de Groot die These verfochten, da die 
«extralingualen Ausdrucksformen», zu denen er die phonetischen 
(einschlieBlich der Sprachmelodie) sowie die mimischen rechnet, 
nicht konventionell-traditioneller, sondern spontan-natiirlicher Art 
seien. Die dieser Anschauung entgegenstehende hebt die sprach- 
melischen Erscheinungen aus den phonetischen Ausdrucksmitteln 
heraus und faBt sie als Mittel sprachlicher Differenzierung auf. 
Diese letztere Auffassung soll an spaterer Stelle gestiitzt werden. 

Das groBe Verdienst dieses iiber Holland hinaus wenig bekannt 
gewordenen Psychologen liegt in anderer Richtung. Er hat auf 


* S. hierzu neuerdings die beiden im Lit.-Verz. angefiihrten Arbeiten von W. Hei- 
nitz und O. v. Essens «Sprechmelodie als Ausdrucksgestaltung» (1952). 
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experimenteller Grundlage gezeigt, daB die extralingualen Aus- 
drucksformen der «Intonation» und der «Mimik» eine hdhere 
Ganzheit bilden. Dieser Nachweis ist um so beachtlicher, als die 
Vorstellungen iiber die physiologischen Grundlagen des stimm- 
lichen Ausdrucks damals noch vollig unklar waren. Das Prinzip hat 
in der Folge seine wichtigste Bestatigung durch den Nachweis 
erhalten, daB die mimischen Verkostungsgesten und der stimmliche 
Ausdruck von Lust und Unlust durch Rachenweite und -enge zu- 
sammengehoren. Auch wirkt auf beiden Gebieten die vegetative Steu- 
erung — man michte heute sagen: selbstverstandlich — gleichsinnig. 
Freilich sind diese Erkenntnisse heute noch keineswegs zum Ge- 
meingut der psychologischen Ausdrucksforschung geworden, die 
sich auf das Gebiet der Mimik und Physiognomik beschranken zu 


kénnen glaubt, wenn es gilt, wichtige Fragen der allgemeinen - 


Ausdruckstheorie zu entscheiden. So ist z. B. die Diskussion iiber das 
Konstanzproblem, d. h. die Frage, ob es eine konstante Zuordnung 
von Ausdrucksbild und seelischen Vorgangen gibt, lediglich auf 
Grund der bei der Mimik feststellbaren Gegebenheiten ausgetragen 
worden (C. Landis, L. Kanner, N. H. Frijda), obwohl die Verhaltnisse 
im stimmlichen Ausdrucksgelande mit seinen relativ viel mehr von- 
einander abgesonderten Ausdrucksgeneratoren wesentlich anders 
liegen als im mimischen Bereich. (Literatur bei W. G. Miihle, «Neue 
Ansatze der Ausdrucksforschung und Ausdruckstheorie», 1955.) 
Ahnlich wie die europaische Stimmforschung sondert auch der 
Amerikaner H. L. Smith jr. drei Hauptsysteme der Kommunikation: 
die Sprache (language), die «vocal qualifiers» (den stimmlichen 
Ausdruck) und «kinesics» (unter welcher Bezeichnung im An- 
schluB an R. L. Birdwhistell Gestik und Mimik zusammengefaBt 
werden). Die Intonation, der der Autor besonderes Augenmerk zu- 
wendet, rechnet er zur Sprache, nicht zu den «vocal qualifiers». 
Leider ist die Schrift «The Communication Situation» nicht im 
offentlichen Buchhandel erschienen, sondern nur fiir den internen 
Gebrauch bei Kursen des Department of State, Washington. 
Gliicklicherweise gibt aber eine gemeinsame Arbeit von R. E. 
Pittenger und H. L. Smith jr. eine Vorstellung tiber den gegenwiar- 
tigen Stand der Ausdruckstheorie des letzteren*. Danach erscheint 
diese nicht tiefenphysiologisch orientiert und bedient sich auch noch 


* Es obliegt mir an dieser Stelle, Herrn Prof. G. E. Peterson und seiner Assistentin 
Dr. J. Lehiste fiir mehrere Hinweise auf amerikanische Literatur meinen besten Dank zu 
sagen. 
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nicht elektroakustischer Registrierungen. Der physiologische und 
akustische Aspekt liegen noch wenig differenziert nahe neben- 
einander. 

Wenngleich nun auch in dem vorliegenden Referat das Ver- 
haltnis des stimmlichen Ausdrucks zur Sprache mit zur Diskussion 
steht, so wurden doch alle Arbeiten iiber den sprachlichen Ausdruck 
an sich (wie etwa die wertvolle, von H. Werner herausgegebene 
Sammlung von Vortraégen «On expressive language», F. Panses 
«Sprache als Bewegung» oder Werke wie « Die Sprache als Quell 
der Seelenkunde» von L. Klages oder «Vom Geheimnis der Spra- 
che» von H. Strehle) sowie insbesondere alle weitere Literatur iiber 
Lautbedeutungslehre nicht einbezogen. Beziiglich des Buches von 
E. Rossi sei auf die Besprechung des Referenten in der Zeitschrift 
«Wissenschaft und Weltbild» verwiesen. 


3. Die Erforschung des pathognomischen stimmlichen Ausdrucks 
a) genetischer Aspekt 


Gegen die weitverbreitete Ansicht, daB die «Intonation» das 
Um und Auf des stimmlichen Ausdrucks bilde, hat sich F. Trojan 
gewandt («Der Ausdruck von Stimme und Sprache», 1948, und 
«Der Ausdruck der Sprechstimme», 1952). Danach setzt dieser 
Ausdruck — im Gegensatz zu der nach Ausweis der Aphasien durch 
die Hirnrinde bedingten Sprache — eine starkere Beteiligung des 
Hirnstamms voraus und wird durch ein ganzheitliches Zusammen- 
wirken einer Mehrzahl von physiologischen Generatoren zustande 
gebracht. Die dabei entstehende Ganzheit ist das «Akuem», der 
jeweilige adaquate stimmliche Ausdruck eines affektiven Gesche- 
hens. Die wichtigsten der durch diese Generatoren bewirkten 
stimmlichen Ausdrucksmerkmale sind: 1. Der Gegensatz von 
Schon- und Kraftstimme als Ausdruck der vornehmlich im Zwi- 
schenhirn anzusetzenden Steuerung des vegetativen Geschehens, 
im besonderen der trophotrop-endophylaktischen und der ergo- 
tropen Funktionsrichtung im Sinne von W. R. Hef; dieser Zusam- 
menhang zwischen dem vegetativen Nervensystem und dem stimm- 
lichen Ausdruck wurde auf interferometrischem, pupillometrischem 
und elektrodermatographischem Wege nachgewiesen (Trojan und 
Mitarbeiter, 1952). 2. Die in den physiologischen Vorgangen der 
Nahrungsaufnahme und des Brechaktes fundierten Ausdrucks- 
gestaltungen von Rachenweite und Rachenenge, die im mimischen 
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Ausdrucksgelande ihre Analoga in den «Verkostungsgesten» des 
stiBen und des bitteren Zuges (XK. Biihler) haben und ebenso wie 
diese dem Ausdruck von Lust und Unlust dienen. DaB Rachenweite 
und -enge ebenso wie Schon- und Kraftstimme Alter als die Sprache 
sind, geht daraus hervor, daB sich schon der Unlustschrei des Saug- 
lings vom spateren Lustschrei durch Rachenenge unterscheidet 
und beide wieder von vorsprachlichen trophotropen AuBerungen 
der Behaglichkeit. Keinesfalls aber koinzidieren Schonstimme und 
Rachenweite bzw. Kraftstimme und Rachenenge in allen Fallen. 
Elektroakustisch wurden beide Gegensatzpaare von Trojan und 
Winckel untersucht. Weitere Merkmale des stimmlichen Ausdrucks 
sind 3. der hauptsachlich durch die extralaryngeale Muskulatur 
zustande kommende Gegensatz von Kopf- und Brustregister (bzw. 


Verschiebungen in der einen oder der anderen Richtung), wodurch | 


ausdrucksmaBig u. a. Uber- bzw. Unterlegenheitstendenzen gegen- 
iiber dem Partner dargestellt werden kénnen, dann 4. die (den von 
A. Flach aufgedeckten und untersuchten motorischen Ausdrucks- 
gestalten parallelen) Spuren gesamtk6rperlicher (anders als 1—3 weit- 
gehend konventionell bedingter) Bewegungen und dazu noch meh- 
rere andere stimmliche Ausdrucksmerkmale, die nach dem gegen- 
wartigen Stand und am vollstandigsten in dem Beitrag von Trojan 
zum «Manual of Phonetics» (1957a) aufgezahlt sind. 

Mit voller Absicht wird in der Akuemtheorie Trojans der In- 
tonation weder in der Reihe der Generatoren noch in der der 
(davon abhangigen) stimmlichen Ausdrucksmerkmale eine selb- 
standige Rolle zugeteilt. Danach ist nicht anzunehmen, daB zu den 
primaren Funktionen des kortikalen Lautgebungszentrums schon 
eine Differenzierung von Tonhohe und -starke geh6rt. Die Tonhdhe 
erscheint vielmehr zunachst heteronom an die Dynamik gebunden, 
wie iibrigens noch weithin im sprachlichen Bereich*. An Stelle der 


* Anzumerken ist hier freilich, daB die Abhangigkeit der Tonhéhe von der 
Dynamik — und dies wohl auch schon auf dem Niveau des stimmlichen Ausdrucks — 
eine doppelte sein kann; es kann gréBere Lautstarke entweder mit einer Erhebung oder 
mit einer Senkung der Tonhdhe einhergehen. In ersterem Fall verbindet sich ein ver- 
starkter Atemdruck mit einer Kontraktion des Ringschildknorpelmuskels und einer im 
Zusammenhang damit erhGhten Spannung der Stimmlippenmuskeln; im anderen Fall 
dagegen mit starkerer Zusammenziehung des Brustbeinschildknorpelmuskels und wohl 
auch des Ringknorpelrachenmuskels, wodurch (nach W. Zenker) die Stimmlippen ent- 
spannt werden kénnen. Es ist anzunehmen, daB hinter beiden Vorgangen verschiedene 
gesamtkorperliche Bewegungsablaufe stehen. Auf sprachlichem Niveau entsprechen den 
beiden Vorgangen z.B. die gegensiatzlichen Melodisierungssysteme, die Ed. Sievers 
unterschieden hat. Wenn er selbst auch spaterhin an dieser Theorie nicht festgehalten 
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fehlenden Differenzierung von Dynamik und Melos gibt es auf dem 
Niveau des stimmlichen Ausdrucks — gleichsam als eine Vorform 
dazu — die schon (Punkt 3) besprochene globale Ausrichtung auf 
eines der beiden Hauptregister. Erst auf sprachlichem Niveau wird 
die Intonation dann in einem gewissen Ausmaf autonom: so in den 
die Bedeutung von Sprachzeichen bestimmenden Sprachténen der 
Tonsprachen und in den (sprachlich-syntaktische Gestaltungen be- 
zeichnenden) Unterschieden der Satzintonation (insbesonders zur 
Charakterisierung von Satzarten), um deren gesetzmaBige Er- 
fassung sich E. Kwirner und seine Mitarbeiter bemiihen. 

Es muB8B weiterer empirischer Forschung vorbehalten bleiben, 
festzustellen, ob und in welcher Hinsicht das eben skizzierte, gene- 
tisch fundierte Modell noch Korrekturen unterworfen werden muB. 
Jedenfalls liegt hier ein wichtiges Problem der neueren « Entwick- 
lungsphonetik» vor, bei dessen Bearbeitung auch die Tierlaute mit- 
beriicksichtigt werden miissen. 

In diesem Zusammenhang sei auch auf die Problematik der auf 
j.B. Rieffert zuriickgehenden Unterscheidung melischen (melodi- 
schen) und rhythmischen Sprechens hingewiesen. Wie Registrie- 
rungen zeigen (sehr sch6n z. B. bei Héffe), treten bei phanomenaler 
Dominanz des Rhythmus bzw. der dynamischen Schwankungen 
auch ebenso betrachtliche Héhenunterschiede auf, die freilich nicht 
als «melodisch» empfunden werden. Demgegeniiber verbindet sich 
bei dem als melodisch empfundenen Sprechen eine nur sanft sich 
verandernde Dynamik mit einer ebensolchen melischen Bewegung. 
Melisches und rhythmisches Sprechen stellen also keine physika- 
lisch-akustischen Gegensatze in dem Sinne dar, als wiirden beim 
rhythmischen Sprechen Tonhdhenschwankungen fehlen. Gerade 
das Gegenteil ist der Fall. Nur treten diese Schwankungen phano- 
menal hinter den dynamischen Veranderungen zuriick. 

Eine andere, gleichfalls mit der Entwicklungsgeschichte in Zu- 
sammenhang stehende Aufgabe der genetischen Forschungsrichtung 
ist der Vergleich des stimmlichen Ausdrucks mit der Sprache. Aus 
logischen Griinden ist es dabei zweckmaBig, beide AuBerungs- 
formen einem héheren Begriff unterzuordnen. Als solcher wurde 


hat, hat doch O. v. Essen das Vorhandensein der beiden Melodisierungsarten an gegen- 
satzlichen Beispielen experimentell nachgewiesen. Nach W. Kuhlmann entspricht im 
Deutschen wie im Englischen der Starkebetonung im weiterweisenden Sprechtakt Tiefer- 
legung, im abschlieBenden Héherlegung, was freilich schon als Beispiel fiir die Autonomie 
der Intonation auf sprachlichem Gebiet gelten kann. 
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der des «Zeichens im weiteren Sinn» verwendet. O. v. Essen halt 
diese Begriffsverwendung fiir kontrovers. 

Wie steht es mit ihrer sachlichen Begriindung? Zuniachst stehen 
stimmlicher Ausdruck und Sprechen einander zweifellos wesens- 
verschieden gegeniiber, wie auch die sprachliche Artikulation nicht 
aus dem stimmlichen Ausdruck hervorgeht (Trojan, 1957b). Der 
stimmliche Ausdruck erweist sich vom genetischen Standpunkt 
nicht, wie ihn noch bis vor kurzem die Psychologen (so etwa 
G. Kafka) und einzelne Erforscher des stimmlichen Ausdrucks auf- 
faBten, als «Ausdruck eines Inneren», sondern als akustisch in Er- 
scheinung tretende Veranderungen der psychophysischen Pers6én- 
lichkeit, ahnlich wie sich bestimmte vegetative Symptome an der 
K6rperoberflache zeigen und dadurch ausdruckshaft wirken. (So 
kann man z. B. die Wirksamkeit der Erectores pilorum beobachten, 
nicht aber etwa die Ausschiittung von Adrenalin.) Allerdings haben 
manche stimmliche Ausdrucksmittel (auch abgesehen von ihrer Will- 
kirlichkeit) nicht mehr diesen symptomatischen, den Reflexen nahe- 
stehenden Charakter, sondern bestehen in Veranderungen der Per- 
s6nlichkeit nach dem Muster bestimmter archetypischer Reaktions- 
weisen. So reagiert man z. B. bei korperlichen oder seelischen 
Schmerzen sowie bei allen Arten von Unlust, als ob man Ekel emp- 
finden wiirde, d.h. mit Rachenenge. Reprdsentiert somit der 
stimmliche Ausdruck Veranderungen der Gesamtpersénlichkeit im 
Verhaltnis zum Partner und zur Sachwelt, so beruht der Sprechakt 
im Gegensatz dazu auf einem sensomotorischen Bogen, durch den 
Vorstellungen und Begriffe, denen afferente Erregungen zugrunde 
liegen, mit jeweils bestimmten motorisch-artikulatorischen, also 
efferenten Erregungsablaufen zusammengeschlossen sind, ohne an 
sich die Gesamtpers6énlichkeit merklich zu alterieren. Die entste- 
henden Produkte, die Sprachzeichen, weisen deutlich genug auf 
diese Entstehung zuriick: sie besitzen einen Zeichenkérper (ent- 
sprechend den Artikulationsvorgangen) und eine Bedeutung. Es ist 
sehr wahrscheinlich, daB8 die Auffassung des Ausdrucks als AuBe- 
rung eines Inneren auf eine unrichtige Ubertragung des spreche- 
rischen Geschehens auf den Bereich des Ausdrucks zuriickgeht. 

Im Laufe seiner Entwicklung hat der stimmliche Ausdruck nun 
freilich immer mehr von seinem urspriinglichen, reflektorisch- 
symptomatischen Charakter eingebiBt, ohne ihn doch vdllig zu 
verlieren. Er kann nun nicht nur willkirlich gehemmt, sondern 
sogar ohne Vorhandensein der entsprechenden affektiven Erregun- 
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gen willkiirlich produziert werden. Dadurch ergibt sich eine ent- 
schiedene Annaherung an die Sprechfunktion. Denn nun kann in 
beiden Bereichen etwas zuriickbehalten und es kbnnen AuBerungen 
getan werden, die der subjektiven oder der objektiven Realitat 
nicht entsprechen. 

Halt man sich die dargelegten Verhaltnisse vor Augen, dann 
diirfte die formale Anwendung des Begriffes « Zeichen im weiteren 
Sinne» kaum zu irgendwelchen Irrtiimern fiihren. Sie soll lediglich 
einen Vergleich zwischen dem stimmlichen Ausdruck und dem 
Sprechen (als der Realisation sprachlicher Normen) erméglichen. 
Bei diesem Vergleich wird bewuBt von der reflektorisch-symptomati- 
schen Wurzel des stimmlichen Ausdrucks abgesehen und vor allem 
die verschiedene Sendetechnik des stimmlichen Ausdrucks und des 
Sprechaktes herausgestellt. Es treten damit die Gegensatze zwischen 
einer simultanen (alle verwendeten Merkmale gleichzeitig 4uBern- 
den) Sendetechnik, wie sie der stimmliche Ausdruck verwirklicht, 
und einer sukzessiven, wie sie durch die zeitliche Abfolge der 
Sprachlaute zustande kommt; ferner zwischen einer herakliteisch 
von Pol zu Pol schwingenden Zeichenstruktur und einer starr oppo- 
sitionellen und endlich zwischen einer internationalen, von den 
Einfliissen der Konvention abgesehen, bei allen Menschen im we- 
sentlichen gleichartigen und einer an nationale Sprachgemein- 
schaften gebundenen Zeichengebung mit aller wiinschenswerten 
Klarheit hervor. 

In aller Kiirze mu8 hier auch noch ein dritter Problemkreis 
erértert werden. Zugrunde liegt ihm die Frage, ob zwischen Aus- 
druck und psychischer Zustandlichkeit eine konstante Beziehung be- 
stehe. Die alteren Ausdruckspsychologen haben eine solche Kon- 
stanz fiir ebenso selbstverstandlich gehalten, wie sie spater von 
C, Landis u. a. radikal geleugnet wurde. Eine positive Wendung 
wurde der Diskussion durch WV. H. Frijda gegeben; nach ihm besteht 
eine Korrelation zwischen den dynamischen Qualitaten des Aus- 
drucks und der jeweiligen spezifisch strukturierten Beziehung einer 
Person zur Umwelt, ihrer jeweiligen « Positionalitat». 

Der Erforscher des stimmlichen Ausdrucks wird sich durch den 
Sturm gegen die Konstanzannahme nicht von seinem Wege ab- 
bringen lassen, wie denn auch W. Héffe, ein neuer verdienstlicher 
Experimentator auf diesem Gebiet, ausdriicklich daran festhalt. 
Da man es auf diesem Gebiet ausschlieBlich mit dynamischen Ab- 
laufen zu tun hat, wird man sich mit Recht auf A. Flach, R. Wérner 
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und WV. H. Frijda berufen kénnen. Dazu kommt, daB der stimmliche 
Ausdruck, wie ausgefiihrt, durch eine Anzahl von verschiedenen 
physiologischen Generatoren zustande kommt und jedem dieser 
Generatoren auf Grund seiner physiologischen Funktion schon ein 
bestimmter, freilich sehr allgemeiner Grundsinn anhaftet. Eine 
Spezifizierung dieses Grundsinnes oder seine analogische Ubertra- 
gung auf verwandte Ablaufe ergibt sich jeweils erst durch die Ein- 
gliederung dieser Ausdruckskomponenten in die Ganzheit des 
jeweiligen Akuems. — 

Auf dem Boden der Akuemtheorie hat H. Weihs («Die Be- 
einflussung der vegetativen Tonuslage durch komplexe akustische 
Reizfolgen [Sprechstimme und Musik]») nachgewiesen, daB dem 
vegetativ gesteuerten Gegensatz von Schon- und Kraftstimme be- 
stimmte musikalische Gegensatze entsprechen und das Anhéren 
trophotrop oder ergotrop gestimmter Musik die entsprechende 
Reaktionslage hervorruft. In einer anderen ihrer Arbeiten, « Die 
physiologische Grundlage des musikalischen Ausdrucks», hat sie 
eine interessante Briicke zu der Lehre von den Phonationstypen 
von R. Lach geschlagen und die mit dem Vegetativum gekoppelten 
musikalischen Formgegensatze an Schuberts «Erlkénig» demon- 
striert. — Teilweise im AnschluB an die Akuemtheorie hat auch 
G. Habermann seine experimentellen Untersuchungen iiber « Phy- 
siologie und Phonetik des lauthaften Lachens» durchgefiihrt. Ohne 
Zusammenhang mit den Arbeiten von H. Wezhs sind neuerdings in 
dem von H. Teirich herausgegebenen Sammelwerk «Musik in der 
Medizin» G. Destunis und R. Seebandt zu den gleichen Ergebnissen 
tiber die Wirkungen beruhigender und erregender Musik auf das 
Vegetativum gelangt. Verwandte Themen behandeln in diesem 
Sammelwerk B. Stockvis und W. Trénkle. — 

In einer Arbeit von R. Husson und G. L. Meinsma steht zwar die 
These im Vordergrund, da stabile Beziehungen zwischen der 
Linguistik und der (Hirn-) Physiologie sich nicht auf phonetischem, 
lexikalischem, morphologischem oder grammatischem Niveau auf- 
finden lassen, sondern nur im Bereich der Syntagmen, der sprach- 
lichen, nicht logischen Begriffsassoziationen. Doch werden hier — 
wenn auch noch z. T. auf der Grundlage der inzwischen wider- 
legten chronaxischen Theorie Hussons — ahnlich wie bei E. Garde 
auch Ausdrucksfragen im Zusammenhang mit ihren neurophysio- 
logischen Substraten erértert und — ebenso wie in einer «Les sur- 
charges affectives du langage oral» tiberschriebenen Note prélimi- 
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naire von Meinsma — evolutionistische Gesichtspunkte geltend ge- 
macht. 

Mehr vom Standpunkt des Psychologen erértert M. Ferenbach 
in ihrem Aufsatz «Probleme der Sprachanalyse» feinsinnig das 
Verhaltnis von sprachlicher Mitteilung und Sprechweise, die Be- 
ziehung zum Partner sowie Fragen des pers6nlichen Sprechtempos, 
des Formniveaus und der Ausdrucksechtheit. In einer ungedruckten 
Dissertation ist endlich F. K. Steindl-Rast auf Grund von psycho- 
logischen Experimenten hauptsachlich an amerikanischen und 
ésterreichischen Kindern den verschiedenen Arten des Kontaktes 
mit dem Partner unter Beriicksichtigung des genetischen Aspektes 
nachgegangen. 


b) gennematischer Aspekt 


Die Ansatzpunkte zu einer Ausdruckstheorie der Sprechstimme 
unter gennematischem Aspekt sind recht verschiedenartig und 
wechseln nach Nationen und Schulen. 

Auf deutschem Boden hat O. v. Essen eine Reihe von Beitragen 
zu der von ihm so genannten « Psychophonetik» verdffentlicht. Er 
geht vorsichtig und systematisch zu Werk und beginnt, wohl weil 
Dauerverhiltnisse sich am relativ sichersten ausmessen lassen, mit 
einer Untersuchung tiber das «Sprechtempo als Ausdruck des psy- 
chischen Geschehens». Hier wird auf experimentellem Wege ge- 
zeigt, daB das Sprechtempo sowohl von der Sprechsituation wie 
vom Bedeutungsgehalt und vom emotionellen Kolorit abhangig ist, 
daB sinnwichtige Teile langsamer gesprochen werden als weniger 
sinnwichtige, Tempoveranderungen aber die relative Dauer der 
Laute nicht beeinflussen. In einer weiteren Studie, die eine Samm- 
lung von vier Aufsaétzen verschiedener Autoren unter dem Titel 
«Sprechmelodie als Ausdrucksgestaltung» erdffnet, will v. Essen 
sodann die Anspriiche der Schallanalyse kritisch tiberpriifen. Dabei 
bestatigt er die altere Anschauung (Ed. Sievers, F. Saran), daB der 
melodische Gang durch diejenigen Redeteile bestimmt wird, die 
einerseits durch die sprachlich festliegenden Akzente, anderseits 
durch die Denkwichtigkeit und die Gefiihlsbetontheit herausge- 
hoben werden. Die Gestalt der Melodie wird danach fiir den Horer 
durch die «Fiihrténe» (Szevers) festgelegt. Diese Anschauung steht 
in keinem Widerspruch zu der an friiherer Stelle dargelegten und 
genetisch begriindeten iiber die primare Abhangigkeit der Tonhéhen- 
differenzierung von der Dynamik. Nun lost freilich v. Essen in der 
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Folge bestimmte Grundformen der Reihenmelodien (d. h. der Me- 
lodien sprechrhythmischer Einheiten) aus dem Zusammenhang 
mit der sprachlich begriindeten Dynamik heraus; dies geschieht 
aber nur zu dem Zweck, die Vortragsweise verschiedener Sprecher 
bei ein und demselben Text miteinander vergleichen zu kénnen. 
Die Abhangigkeit der Intonation von der rhythmischen Gestaltung 
eines Ausspruchs (den mit Nachdruck gesprochenen Silben) lehrt 
v. Essen (S. 13) ausdriicklich auch in seinem praktischen Zwecken 
dienenden «Grundziigen der hochdeutschen Intonation», die ein 
Gegenstiick zu dem « Handbook of English Intonation» von Arm- 
strong und Ward bilden sollen. Hier wie in seiner «Sprecherischen 
Ausdrucksgestaltung», einer fiir die Fernseh- und Rundfunkpraxis 
bestimmten Schrift, bewegt sich dieser Autor freilich weniger auf 
dem Gebiet des stimmlichen Ausdrucks i.e.S., als vielmehr auf dem 
der Héheren Leselehre und setzt auf diesem Boden die Tradition 
der linguistischen Theorie vom psychologischen Subjekt und Pra- 
dikat (H. Weil, Ph. Wegener, G. v. d. Gabelentz, O. Behaghel u.a.) so- 
wie der Lehren von H. Klinghardt und E. Drach fort. Dabei folgt die 
Gliederung des Stoffes in der zuletzt genannten Schrift aber doch 
den akustisch-gennematischen Hauptdimensionen, auf die sich die 
in ihr namhaft gemachten acht phonetischen Komponenten ohne 
Schwierigkeit zuriickfiihren lassen. Auch wer nicht in allen Punkten 
mit v. Essen iibereinstimmt, wird den von ihm angenommenen 
Zusammenhang zwischen Bedeutung, Dynamik und Melos als 
richtig anerkennen kénnen. 

Diesem Problemkreis gegeniiber tritt in den Schriften v. Essens 
die Erforschung des affektiven stimmlichen Ausdrucks zuriick. Dies 
darf im Rahmen streng gennematischer Forschung nicht darauf 
zuriickgefiihrt werden, daB dieser Autor noch die iiberholte An- 
schauung vertritt, daB sich im Ausdruck seelisches Geschehen kér- 
perlich manifestiere und die Muskeln des Kehlkopfes besonders 
leicht und schnell auf seelisches Geschehen reagieren. Auch ein 
neuerer, gerade um die gennematische Erforschung des stimmlichen 
Ausdrucks bemiihter Autor, W. Héffe, steht noch auf dem gleichen 
Standpunkt. 

Hoffe hat seine Versuchspersonen in Sprechsituationen ge- 
bracht, aus denen heraus ein jeweils verschieden gefarbtes «Ja» 
aufgeklungen ist. Dieser Vorgang, Affekte aus der Redesituation zu 
entwickeln, ist sicherlich ein gliicklicher Griff. Die gewonnenen 
Einwortsatze hat der Autor dann mit betrachtlichem apparativem 


Trojan, Die Ausdruckstheorie der Sprechstimme 135 


Aufwand nach Tonhohe, Schalldruck und Klangfarbe registriert 
und im einzelnen beschrieben. Dabei ergibt sich eine iiberraschende 
Ubereinstimmung mit der Akuemtheorie. So sind z. B. die auch 
vom Autor als verwandt erkannten Ausdrucksformen des kérper- 
lichen Wohlbehagens und des Trostes vorziigliche gennematische 
Darstellungen der Schonstimme, wahrend die anderen Aufnahmen 
wieder charakteristische Belege fiir verschiedene Arten der Kraft- 
stimme und des verstandesmafigen Ausdrucks sind. Die Phon- 
messungen stimmen in den drei Gruppen mit den von Trojan und 
Winckel gemessenen Werten sehr nahe iiberein. 

Was die Diskrepanzen von Dynamik und Melos betrifft, auf die 
Hoffe nachdriicklich hinweist, so ist das Auseinandergehen von 
Schalldruck- und Grundfrequenzkurve bei der Frage und beim 
Zweifel nach dem friiher Ausgefiihrten von den sprachlichen Be- 
deutungsgehalten her zu verstehen. In den Fallen aber, in denen 
eine solche Abweichung zu Beginn der Registrierung auftritt, ist 
bei dem nun einmal gewahlten Lautbild ein EinfluB des Vokal- bzw. 
Stimmklangwechsels (1, J—A) nicht auszuschlieBen. Im ganzen aber 
bezeugt die Arbeit von Héffe, daB alle Aussicht besteht, daB sich die 
genetische und die gennematische Erforschung des stimmlichen 
Ausdrucks bald der Gemeinsamkeit ihrer Probleme bewuBt werden. 

Wahrend die Hamburger Schule die Tradition der experimen- 
tellen Phonetik zu wahren sucht, nutzt die eben erwahnte Ar- 
beit die neueren elektroakustischen Verfahrensweisen. Sie schei- 
nen in der Tat fiir die Erforschung des stimmlichen Ausdrucks in 
hohem Ausma8 geeignet zu sein, da es hier vor allem auf die Be- 
stimmung der nichtstationdren Klangbesonderheiten, der Aus- 
gleichsvorgange, und die Analyse der Klangspektren iiberhaupt 
ankommt. Wenn es auch auBerhalb der Aufgabe dieses Referates 
liegt, die Methoden, Apparaturen und Forschungsergebnisse der 
physikalischen Akustik in die Darstellung einzubeziehen, so kann 
doch an dem einen oder anderen ihrer Vertreter gezeigt werden, 
daB sich die Interessenspharen teils enge beriihren, teils sogar decken. 

Auf deutschem Boden reprasentiert F. Winckel eine ausgespro- 
chen Asthetisch orientierte Schallforschung. Er legt zunachst in der 
Schrift « Klangwelt unter der Lupe» itiberzeugend dar, da Musik 
wesensmaBbig auf eben jenen nichtstationaren, durch Einschwin- 
gungsvorgange, Kombinationsténe, Intonationschwankungen, 
Raumeinfliisse u.a. standig in ihrer Klangfarbe wechselnden 
Schallwerten beruhe. Nachdem dann Winckel (1952b) Klang- 
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analysen bei bestimmten, auch fiir die Ausdrucksforschung wichti- 
gen technischen Griffen der Stimmbildung (Stiitzfunktion, Decken, 
Brust- und Kopfklang usw.) veréffentlicht hatte, tritt in weiteren 
Arbeiten die Frage nach den Qualitatsmerkmalen einer guten 
Gesangs- und Sprechstimme in den Vordergrund. Von hier aus 
ergeben sich Beziehungen zur pathognomischen und physiognomi- 
schen Ausdrucksforschung; unmittelbar in ihr Gebiet fiihren dann 
die schon erwahnten «Elektroakustischen Untersuchungen zur 
Ausdruckstheorie der Sprechstimme». 

Auf diesen Wegen erschlieBen sich zugleich Zusammenhange 
zwischen der Ausdrucksforschung und der Informationstheorie. Von 
dieser Seite und zugleich von der physikalischen Akustik kommt der 
Franzose A. Moles an den Problemkreis des stimmlichen Ausdrucks 
heran. Er unterscheidet semantische und dsthetische Informationen 
(was der hier getroffenen Unterscheidung von Sprache und stimm- 
lichem Ausdruck entspricht). In der asthetischen Information spielt 
der Vokalismus, in der semantischen der Konsonantismus die 
wichtigere Rolle. (Das Verhalten beider ist, wie die Akuemtheorie 
gezeigt hat, auch innerhalb des stimmlichen Ausdrucks von der 
jeweiligen vegetativen Reaktionslage abhangig.) Um die ver- 
schiedenen «Gestalten» des stimmlichen Ausdrucks bei der AuBe- 
rung verschiedener Affekte miteinander vergleichen zu kénnen, hat 
Moles die beim Sprechen eigens praparierter Texte mittels Bathy- 
meter registrierten Lautstarkekurven in Form von Diagrammen 
(Histogrammen) dargestellt. Auch er versucht, die Qualitat von 
Stimmen zu objektivieren; gut sind nach diesem Autor solche 
Sprechstimmen, bei denen der ganze zur Verfiigung stehende 
Dynamikbereich von 50 Dezibel ausgeniitzt ist, schlecht, wenn sie 
sich nur in einem Bereich von 20-30 Dezibel bewegen. 

Die Erforschung des stimmlichen Ausdrucks in den Nieder- 
landen ist durch die Akuemtheorie angeregt worden. Auf dem 
8. Internationalen KongreB fiir Logopadie und Phoniatrie in Am- 
sterdam haben L. Kaiser und mehrere ihrer Schiller iber Versuche 
berichtet, die dahin zielen, durch Beschrankung einer affektiven 
Au8erung auf einen kurzen Ausruf oder gar nur einen einzigen 
Vokal den extralingualen Faktor zu isolieren. L. Kaiser hat die 
Klangvariationen beschrieben, die sich beim Sprechen des Refrains 
«evoé» in einem Gedicht von Vondel ergeben haben, B. Lastotzkin 
Pelsky—und neben ihm, A. de Graaff und B. H. Nijland—haben elektro- 
akustische Analysen von emotionell verschieden gefarbten Vokalen 
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durchgefiihrt. Die Klanganalysen bei Trauer und Ekel zeigen deut- 
lich die Einschrankung in den héheren Frequenzbereichen, die von 
Trojan und Winckel spater als Ausdruck der faukalen Enge aufgezeigt 
wurde. Ebenso stimmt auch die Charakteristik der aktiven Emo- 
tionen mit der der Kraftstimme iberein. 

Einen weiteren interessanten Beitrag zur Ausdrucksforschung 
hat Frau Kaiser 1953 (a und b) geleistet. Sie lie8 Folgen von drei, 
in ihrer Intensitat und Dauer gleichférmigen Ténen von Versuchs- 
personen beurteilen. Dabei charakterisierten die weiblichen unter 
ihnen die Tonfolgen fast ausschlieBlich dadurch, daB sie diesen 
ahnlich gestimmte sprachliche AuBerungen zuordneten, wahrend 
die mannlichen Versuchspersonen sie psychologisch oder linguistisch 
(nach den Beziehungen zu den verschiedenen Satzarten) beurteil- 
ten. Aus dem Versuch ergab sich, daB das erste Intervall mehr fiir 
die psychologische, das zweite mehr fiir die linguistische Interpre- 
tation mafgeblich ist. Frau Kaiser versucht dieses auffallende Er- 
gebnis durch die verschiedene Leitungsgeschwindigkeit im Hirn- 
stamm und in der Hirnrinde zu erklaren. Es ware aber auch zu 
erwagen, ob bei der ganzheitlichen Deutung der gesamten Ton- 
bewegung nicht die linguistische Interpretation des zweiten Inter- 
valls vornehmlich durch die Erfahrung von der sprachlichen Wich- 
tigkeit der den Satz abschlieBenden Intonationsphase motiviert war. 

Einen eigenen und vielleicht etwas eigenwilligen Weg zur Er- 
griindung des stimmlichen Ausdrucks hat sich der Portugiese A. de 
Lacerda — bekannt als Mitarbeiter P. Menzeraths — gebahnt. Sein 
Buch «Analise de expressdes sonoras de compreensdo» ist 1950 
erschienen, zwei Jahre nach der Akuemtheorie und zu gleicher Zeit 
wie die ersten Untersuchungen aus der Schule L. Kaisers, aber von 
keiner dieser Seiten her beeinfluBt. De Lacerda nimmt den von einem 
einzigen Sprecher mit jeweils verschiedenem Ausdruck gesproche- 
nen Ausruf «Ah» auf Schallfolie (disco) auf und registriert diese 
Aufnahmen mit den seit 1932 von ihm entwickelten und zuletzt von 
G. Hammarstrim beschriebenen Methoden der Chromographie und 
Tonometrie. Uber eine eingehende Darlegung der dabei gewonne- 
nen Ergebnisse hinaus unterwirft er auch noch die Tonband- 
aufnahmen einer subtilen subjektiven Beurteilung und glaubt selbst 
noch bei den kiirzesten, nicht einmal 200 Millisekunden dauernden 
Ausrufen bis zu fiinf hintereinander folgende, abgrenzbare, psycho- 
logisch verschiedenartige Ausdrucksgehalte sondern zu konnen*. 
~ * Die Aufnahmen wurden dabei auch mit herabgesetzter Geschwindigkeit abgehdrt. 
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So z. B. Nr. 7 —ich zitiere die Originalbezeichnungen: /Descoberta/ 
Aceitagao/Confirmagao/Importancia/Indeterminacao/. Demgegen- 
tiber nimmt die Akuemtheorie an, daB die akustisch wirksamen 
Komponenten der verschiedenen stimmlichen Ausdrucksgenera- 
toren — im Gegensatz zu den sukzessiv gesendeten Sprachzeichen — 
simultan wahrend der gesamten Dauer des spezifisch gefarbten 
Ausdrucks hérbar werden. Dabei soll natiirlich nicht verkannt 
werden, da8 der Einsatz und eine z. B. nach Art der Fragesatze am 
Schlu8 aufsteigende Intonation an bestimmte Stellen eines Ausrufs 
gebunden sind. 

Die bis 1946 erschienene amerikanische und europdische Li- 
teratur iiber « Psychologische Aspekte der Sprachmelodie» (unter 
der hier wie auch sonst so haufig alle wahrnehmbaren Ziige des 
stimmlichen Ausdrucks verstanden werden) hat L. Zucker vom ' 
Standpunkt der Gestalttheorie M. Wertheimers zusammenfassend 
besprochen. In dieser alteren Literaturschicht werden in der Stimm- 
forschung zu einem groBen Teil Wege beschritten, die in dem hier 
zu besprechenden, folgenden Zeitabschnitt kaum noch begangen 
werden. So hat man — im Anschlu8 an die Rundfunkexperimente 
T. H. Pears — die psychologisch gewiB interessante Frage in den 
Vordergrund geriickt, ob Laien imstande sind, allein aus dem 
Stimmklang die Art einer Emotion oder (auf stimmphysiognomi- 
sches Gebiet hiniibergreifend) die physischen Charakteristika eines 
Sprechers zu erkennen. Noch 4lter sind die (von L. Zucker unter 
Berufung auf die Gestalttheorie nicht mit Unrecht kritisierten) Ver- 
suche, die Vorginge innerhalb einer bestimmten akustischen Di- 
mension (wie der Tonhdhe oder der Intensitat) auf bestimmte 
Personlichkeitsziige zu beziehen. Dagegen haben die zahlreichen 
amerikanischen Untersuchungen aus den zwanziger und dreifbiger 
Jahren tiber das Vibrato zu der schon genannten wichtigen Er- 
kenntnis gefiihrt, daB es gerade die Abweichungen von den sta- 
tionaren Tonhodhen sind, die emotionellen und dsthetischen Aus- 
druckswert haben. 

Eine ahnliche Richtung wie die neuere europdische Stimm- 
forschung — wenngleich ersichtlich nicht von ihr beeinfluBt — schlagt 
in Amerika erst H. L. Smith ein. Hier kann an das schon frither 
uber ihn Gesagte angekniipft werden. Smith unterscheidet in der 


Doch stand ein Speech-strecher dem Autor erst zu einem spateren Zeitpunkt zur Ver- 
fiigung (vgl. hierzu A. de Lacerda und P. D. Strevens: Some Phonetic Observations using 
a Speech-Strecher. Revista do laboratério de Fonética experimental 3: 5-16 (1956). 
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schon genannten Arbeit (gemeinsam mit R. E. Pitienger) sechs «vo- 
cal qualifiers», von denen drei akustischen Dimensionen (der In- 
tensitat, der Tonhéhe und dem Tempo) entsprechen. Die anderen 
drei Ausdrucksgegensatze heiBen: spread and squeezed register, 
rasp and openess, drawl and clipping (der letztere Gegensatz 
bezieht sich auf die einzelne Silbe). Eine tiefere physiologische Fun- 
dierung dieser Ausdrucksmittel wird, wie schon gesagt, nicht ver- 
sucht. 

Besonderes Augenmerk wendet Smith den Fragen der Intona- 
tion zu. Dem EinfluB der Emotionen auf die Intonation, also dem 
Verhaltnis des emphatischen und des logischen Akzentes geht 
S. Morishita an englischen Sprachproben nach. 

Von Wichtigkeit fiir die Ausdrucksforschung sind auch die 
Untersuchungen iiber die «Aquivalenz», wie sie von T. Chiba und 
M. Kajeyama sowie von G. E. Peterson durchgefiihrt wurden. Aqui- 
valent sind Phoneme, die von verschiedenen Sprechern, aber gewif 
auch solche, die von ein und demselben Sprecher in verschiede- 
nen Affektlagen gesprochen werden. 

Einen interessanten Beitrag zur Erforschung des gesanglichen 
Ausdrucks haben endlich D. B. Fry und Lucie Manén (vom University 
College, London) geleistet. Sie haben Einzelt6ne von verschiedener 
dramatischer Qualitat, Affektlage und Artikulation untersucht. Die 
Spektren der drei untersuchten Affekte (Aggression, Freude und 
Angst) zeigen Unterschiede, die den von Trojan und Winckel an 
Sprechproben beobachteten gleichen. 


4, Die Erforschung des physiognomischen stimmlichen Ausdrucks 


Einen Uberblick tiber den Stand der charakterologischen 
Sprach- und Stimmdiagnostik gibt der 1948 erschienene Aufsatz 
von F. Kainz «Sprache, Persénlichkeit und Charakter». Er kommt 
hier nur insoweit in Betracht, als er sich mit der Analyse der 
Sprechweise befaBt. Doch laufen die Methoden dieser Analyse mit 
denen der Sprachanalyse weitgehend parallel. So laBt sich nach 
Kainz fir beide die Anwendung autonomer und heteronomer 
Typensysteme unterscheiden, je nachdem ob die Einteilungsgriinde 
primar am sprachlichen oder sprecherischen Material gefunden 
werden oder nicht. Beispiele fiir heteronome Typologien sind 
Sprach- bzw. Sprechanalysen, die etwa die Systembegriffe von 
C. G. Jung, E.R. Faensch, G. Pfahler oder E. Kretschmer zugrunde 
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legen. Ein Beispiel fiir eine autonome Typologie ware nach Kainz 
eine Unterscheidung sprach- und sachkoharenter Typen. Kainz gibt 
in der Folge dann auch einen Uberblick tiber die Ansatze zu einer 
charakterologischen Analyse der Sprechweise, die sich an Namen 
wie T. H. Pear, H. Herzog, 7. B. Rieffert, M. Keilhacker, Th. Weiske 
u. a. kniipfen, also an Autoren, deren Arbeiten vor dem hier zu 
besprechenden Zeitraum erschienen sind. 

Neben der Unterscheidung autonomer und heteronomer Ty- 
pensysteme kommt fiir die Pers6nlichkeitsdiagnostik aus der Stimme 
natiirlich auch wieder die Scheidung des genetischen und des genne- 
matischen Aspektes in Betracht. Fiir den genetischen Aspekt ist hier 
die Endokrinologie von besonderer Wichtigkeit (wie fiir den pa- 
thognomischen Aspekt nach der Akuemtheorie die neuro-vegetative 
Steuerung). Den Entwurf einer Endokrino-Phoniatrie hat 7. H.° 
Amado 1953 vorgelegt, allerdings noch zum Teil auf die chronaxische 
Theorie R. Hussons gestiitzt. Es ist zu hoffen, daB sich — davon ab- 
gelost — der fruchtbare Kern weiterentwickeln wird. 

In dem hier zu besprechenden Zeitraum stiitzen sich die stimm- 
diagnostischen Arbeiten fast durchgehends auf allgemein charakte- 
rologische Typologien, verwenden also heteronome Systeme. Es 
erscheint zweckmaBig, hier nicht die Verschiedenheit der Aspekte, 
sondern die der jeweiligen Typologien als Einteilungsgrund zu ver- 
wenden. 

An der Kérperbau- und Charakterlehre E. Kretschmers orien- 
tieren sich die Arbeiten von R. Heidrich und R. Fahrmann. Heidrich 
hat an 75 Versuchspersonen zuerst verschiedene stimmliche und 
sprachliche Merkmale nach der Haufigkeit ihres Vorkommens und 
in ihren gegenseitigen Bezichungen und Kuppelungen untersucht 
und ist sodann am gleichen Material dem Zusammenhang von 
Kérperbau, Stimme und Sprechweise nachgegangen. Die von ihm 
nur subjektiv beobachteten stimmlichen Merkmale gehéren durch- 
wegs dem gennematischen Aspekt zu und lassen sich demgema 
auf die Grunddimensionen des Akustischen zuriickbeziehen. Dar- 
uber hinaus wird aber auch die Art der Textinterpretation be- 
urteilt. Hauptergebnis ist, daB die Versuchspersonen der leptosom- 
schizothymen Wesensart durch langsames Sprechtempo, mit gleich- 
mafigem Tempowechsel, zumeist auch mit gleichbleibendem 
Rhythmus gekoppelt, und durch intellektuelle, textgebundene und 
monologisierende Textinterpretation bei ausgesprochenem Inhalts- 
primat gekennzeichnet waren; dagegen fand sich bei der pyknisch- 
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zyklothymen Gruppe ein schnelles Sprechtempo mit ungleichem 
Tempowechsel in Verbindung mit ungleichmaBigem Rhythmus 
sowie eine gefiihlsmaBige, dialogisierende Textinterpretation bei 
6fters anzutreffendem Primat der Ausdrucksmittel. 

Gleichfalls auf Kretschmer, aber zugleich auf die entwicklungs- 
geschichtliche Deutung und Erweiterung seiner Lehre durch 
K. Conrad gestiitzt, stellt R. Fahrmann in drei Aufsatzen die Sprech- 
weise der zyklothymen, der schizothymen, der viskésen und der 
spirituellen (dem S-Typus bei E. R. Faensch entsprechenden) Tem- 
peramente auf Grund von Experimenten dar, die er schon 1947/48 
an 100 Versuchspersonen durchgefiihrt hat. Methodisch besteht 
eine groBe Ahnlichkeit zwischen dieser Arbeit und der von Heidrich. 
Beide Autoren beurteilen die Sprechweise im wesentlichen nur mit 
subjektiven Mitteln und bedienen sich dabei auch ahnlicher Ord- 
nungsschemata. Auch die Ergebnisse decken sich zum guten Teil. 
(Heidrich gliedert freilich anders: er rechnet die Viskésen zu den 
Schizothymen und sondert die Spirituellen nicht als eine eigene 
Gruppe ab.) Als Unterschiede zwischen den Zyklothymen und den 
Schizothymen ergeben sich bei Fahrmann beispielsweise: Stimmlage 
generell tiefer — generell héher; Sprechtempo langsam bis mittel 
(gelassen) — rasch (!); Artikulation weich gleitend — scharf ausge- 
pragt; Sprechstil: mehr gefiihlsmaBig, dialogisierend — intellektuell, 
monologisierend. Neuerdings hat endlich die Kretschmerschen Kon- 
stitutionstypen mit exakten Registrierungen und statistischer Aus- 
wertung der Ergebnisse G. Griinewald untersucht (s. u.). 

Auch im Rahmen anderer charakterologischer Typenlehren 
beginnt sich die Erkenntnis von der Relevanz des sprecherischen 
und sprachlichen Ausdrucks Bahn zu brechen. So sagt R. Le Senne: 
«L’allure de la voix est un des élements les plus importants de 
Panalyse caractérologique.» An S. H. Sheldon, dem wir die treffende 
Unterscheidung der «unrestrained voice» seines somatotonen Typus 
von dem «vocal restraint» des cerebrotonen verdanken, wird im 
folgenden anzukniipfen sein. 

Nachdem Th. v. Beckerath in einer ungedruckten Diplomarbeit 
gezeigt hatte, daB sich die Akuemtheorie auch persénlichkeits- 
diagnostisch verwerten lasse, entwickelte F. Trojan (1955a, hierzu 
auch 1955b) auf der Grundlage dieser Theorie einen Persénlich- 
keitstest, den « Gefiihlsresonanztest» (GRT). Diesem Test liegt eine 
gréBere Anzahl von auf Tonband festgehaltenen Textproben affek- 
tiven Ausdrucks zugrunde. Die Versuchspersonen werden ange- 
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wiesen, die Erinnerung an die selbsterlebten Gefiihlserregungen der 
jeweils gleichen Art in sich zu erwecken und deren Starke und 
Haufigkeit nach drei Stufengraden zu bestimmen. Der Auswertung 
des Testergebnisses liegt der Gedanke zugrunde, daB die geneti- 
schen Merkmale der Stimme (wie z. B. das Vorwalten der Schon- 
oder Kraftstimme, der Rachenenge oder -weite) bestimmten Ziigen 
der Persénlichkeitsstruktur bzw. den von der Versuchsperson be- 
vorzugten Haltungen zugeordnet sind und daher auch die Reak- 
tion auf die in den einzelnen Textproben hervortretenden Merkmale 
pers6nlichkeitsdiagnostische Schliisse gestattet. Die Textproben und 
ihre Beurteilung durch den Probanden lassen sich thematisch und 
nach den genetischen Merkmalen ihres stimmlichen Ausdrucks auf 
drei Funktionsrichtungen aufteilen: die beiden jeweils vorherr- 
schenden vegetativen und eine (vornehmlich) kortikale. Die drei 
Leistungsrichtungen entsprechen den drei Wesensanteilen in der 
Temperamentlehre Sheldons, ohne daB jedoch hier der anfechtbare 
Zusammenhang mit den drei Keimblattern aufrechterhalten wird. 
In einer anderen Arbeit hat Trojan die Anwendbarkeit des GRT auf 
geistesgeschichtliche Werke dargelegt, wahrend H. Stelzig den 
«Ackermann» mit den begrifflichen Mitteln der Akuemtheorie un- 
tersucht hat. Neben, aber auch unabhangig von diesem Test laBbt 
sich auch eine Stimmanalyse nach genetischen Gesichtspunkten 
durchfiihren. Sie darf — ebenso wie die nach den Methoden der 
Schule Kvretschmers (also nach gennematischen Gesichtspunkten) 
vorgehenden Stimmanalysen — als projektiver ‘Test angesehen 
werden. 

Dem Zusammenhang von Persénlichkeitsstruktur und Stimm- 
stérungen ist H. Weihs in mehreren Arbeiten nachgegangen, wobei 
sie den GRT nicht nur, wie schon Frau v. Beckerath, mit anderen 
Testverfahren gekoppelt hat, sondern sich auch mehrerer physiolo- 
gischer Untersuchungsmethoden bedient hat. 

Ohne Beziehung zu einer konkreten charakterologischen Ty- 
pologie, aber auch nicht im Sinne einer autonomen Typologie be- 
spricht M. Simonet in seiner « Charakterologischen Symptomlehre» 
diagnostisch wichtige Symptome des Sprechens. Er scheidet kon- 
stante von situationsabhangigen Symptomen und nennt im An- 
schlu8 an E. Drach und 7. B. Rieffert die folgenden Sprechmerk- 
male: Tonlage, Klangfarbe, Lautheit, Melodie, Artikulation, Ak- 
zentuierung, Tempo und Rhythmus. Er betont 4hnlich wie schon 
T. H. Pear, daB Volks- und Stammeszugehorigkeit um das Indi- 
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viduum einen eingrenzenden Rahmen legen, der freilich, wenn 
man die totale Symptomatik der Individualitét beherrscht, im 
symptomatischen Akt der Diagnose nicht notwendig beriicksichtigt 
werden mu. Ein KongreBvortrag desselben Autors war kiirzlich 
der Analyse von Politikerstimmen gewidmet. 

In einer ungedruckten Dissertation «Die Bedeutung der Stimme 
und Sprechweise fiir die Pers6nlichkeitsdiagnose beim Blinden» hat 
E. Dorner endlich auf die wichtige Tatsache hingewiesen, daB Blinde 
nicht nur in besonderem MaBe an dem Erkennen der Persénlichkeit 
aus diesem Aspekt interessiert sind, sondern sich unter ihnen auch 
beachtlich gute Amateurdiagnostiker befinden. Dies bezeugt auch 
der kleine Aufsatz des Kriegsblinden F. Feistner iiber « Einige wich- 
tige Stimmtypen». 


5. Die Erforschung des pathologischen stimmlichen Ausdrucks 


Schon in einer 4lteren Arbeit hat P. 7. Moses Stimmlage, Re- 
gister, Resonanz, Atmung und Rhythmus, weiter auch Pathos, 
Tempo und Melismen als Stammbegriffe der Stimmbeurteilung 
aufzuweisen gesucht. Wenn er sich auch gelegentlich auf Sheldon 
bezieht, so stellt dessen Typologie doch nicht sein Bezugssystem dar, 
das vielmehr, wie dann besonders sein Buch «The Voice of Neu- 
rosis» zeigt, die Begriffsordnung der Psychoanalyse ist. Der Larynx 
— das ist die zentrale These dieses Autors — ist ein sekundiares 
Geschlechtsorgan, und Brust- und Kopfregister entsprechen dem 
mannlichen und dem weiblichen Wesensanteil der Person. An- 
zeichen fiir die erfolgreiche Identifizierung mit dem Vater ist der 
vollzogene Ausgleich der Register, wahrend ihre Divergenz immer 
einen Konflikt in der Identifizierung aufzuzeigen scheint. Dem- 
gegeniiber soll die Aufteilung der beiden Hauptregister in zwei ver- 
schiedene Stimmformen fiir den Schizophrenen kennzeichnend sein. 

Gegeniiber der These von der Internationalitat des stimmlichen 
Ausdrucks (die freilich von niemand ohne den einschrankenden 
Begriff der Konvention vertreten wird) unterstreicht Moses die 
Raum- und Zeitgebundenheit des stimmlichen Ausdrucks (neben 
der er freilich manche allgemein durchgehende Ziige gelten laBt). 
Neuerdings (1958) hat er allerdings seinen Relativismus noch ver- 
scharft. 

Wahrend sowohl Simoneit wie Moses Anhanger einer subjektiven 
(nicht registrierenden) Stimmbeurteilung sind, hat L. Kaiser mit 
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zahlreichen Mitarbeitern die Sprechweise und Sprache von je 
hundert normalen und abweichenden hollandischen Schulkindern 
mit exakten physiologischen, phonetischen und _psychologisch- 
linguistischen Methoden untersucht. Unter den abweichenden be- 
fanden sich mit Gaumenspalten behaftete, spastische, schwerhorige, 
taubstumme, debile, stotternde und dyslexische Kinder. In das 
hier zu besprechende Gebiet fallen die Registrierungen des Timbres 
(nach Mundéffnung, Palato-, Spektro- und Oszillogrammen), der 
Dauerverhiltnisse sowie der Intensitaéts- und Tonhdhenunter- 
schiede. Die Korrelation zwischen den einzelnen Untersuchungs- 
reihen wurden statistisch ausgewertet und die Eigentiimlichkeiten 
der abnormen Kinder zusammenfassend herausgestellt. Auf die 
Einzelergebnisse dieser ausgezeichneten Arbeit kann hier leider 
nicht eingegangen werden. 

Fir psychiatrische Zwecke haben in den Vereinigten Staaten 
R. E. Pittenger und H. L. Smith jr. die methodischen Grundlagen fiir 
sprachliche und stimmliche Analysen von auf Tonband aufgenom- 
menem Interviewmaterial gelegt. Nachdem O. A. Will und R. A. 
Cohen schon 1953 ein aufgenommenes Interview mit einem psycho- 
logischen Kommentar versehen hatten, analysierte NV. McQuown 
dasselbe Interview nach der Methode von Pittenger und Smith jr. 

Eine instruktive Studie itiber den Zusammenhang zwischen den 
Theorien der Linguistik und der Psychiatrie veréffentlichte M/. Lo- 
renz 1952. Steht hier auch die psychiatrische Sprachpathologie im 
Vordergrund, so beriihrt die Verfasserin doch auch Fragen des 
pathognomischen und — auf £. Sapir gestiitzt — des physiognomi- 
schen stimmlichen Ausdrucks. In ihren gemeinsam mit S. Cobb 
verdffentlichten Studien iiber das Sprachverhalten manischer und 
psychoneurotischer Patienten ist freilich der Beobachtung des 
stimmlichen Ausdrucks nur geringer Raum gegénnt. 

Nur wenig iiber den sprachlich-stimmlichen Ausdruck ist auf 
deutschem Boden auch in der trotzdem fiir die Stimmforschung 
wichtigen ausgezeichneten Studie von S$. Engel «Uber den Aus- 
druck der zyklothymen Depression» zu finden. Experimentell- 
phonetische Untersuchungen an Epileptischen haben R. Luchsinger 
und R. Brunner veréffentlicht;, einen Vergleich zwischen den Into- 
nationskurven bei Normalen und bei Manisch-Depressiven zieht 
H. H. Wangler. Auf eine Reihe von Arbeiten, in denen Sprach- 
pathologisches aus der Sicht vergleichender Ausdrucksforschung 
untersucht wird, soll im letzten Abschnitt verwiesen werden. 
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Ein interessanter Weg zur Psychotherapie vermittels des 
pathologischen stimmlichen Ausdrucks ist endlich von W. Wilhelm 
aufgewiesen worden. Er vermittelt dem Konsultierenden das Er- 
lebnis einer Selbstbegegnung mit der eigenen Stimme, wobei es — 
wenigstens in leichteren Fallen — tiber einen anfanglichen Schock 
zu einer Auseinandersetzung mit der eigenen Stimme und zuletzt 
zu einer Selbstkorrektur der eigenen Persénlichkeit kommen soll. 


6. Der stimmliche Ausdruck in der vergleichenden Ausdrucksforschung 


Grundbegriffe einer vergleichenden Ausdruckskunde hat G, 
Griinewald entwickelt. In einem 1954 erschienenen Aufsatz hat er 
Handschrift und Sprechweise einer Gruppe von Versuchspersonen 
nach bestimmten, einander entsprechenden Merkmalen — wie 
Fliissigkeit, Lange der Impulse, Gespanntheit und Nachdruck — 
miteinander verglichen und individuelle Kongruenzen (Uberein- 
stimmungen) feststellen kénnen. In einer spiateren, in dieser Zeit- 
schrift erschienenen Arbeit (1957b) dient als terminologische Grund- 
lage, daB die Konsistenzen und Inkonsistenzen im Verband einer 
Person sowohl Korrespondenzen von Sprech- und Schreibmerk- 
malen wie auch komplexe ausdruckspsychologische Kongruenzen 
umfassen. Indessen verlagert sich das Schwergewicht in dieser wie 
auch in einer Reihe anderer vom Autor und seinen Mitarbeitern 
planmaBig entwickelten Untersuchungen vom Bereich des Aus- 
drucks auf den der Schreib- und der Sprechhandlung als solcher. 
Wohl lassen sich nach Griinewald bei beiden Aktionen, wenn auch 
mit verschiedenem Anteil, Handlungs-, Darstellungs- und Aus- 
drucksziige unterscheiden; aber das eigentlich Gemeinsame bilde 
doch die Sendung sprachlicher Zeichen mittels gewisser motorischer 
Ausfiihrungsorgane und mit einer bestimmten Vollzugsdynamik. 
Sprechen und Schreiben werden danach durch ihre Dynamik und 
die Weise ihrer Zeichengebung charakterisiert. 

Diese Auffassung des jeweiligen Ausdrucks als Modus von 
Sprachhandlungen zielt darauf hin, bestimmte Ausdrucksziige 
durch Messung vergleichen und das Ausma8 von Ubereinstimmun- 
gen feststellen zu kénnen. Auf eine biologische Deutung und We- 
sensbestimmung des Ausdrucks ist es bei dieser begrifflichen Grund- 
lage zunachst nicht abgesehen. 

Von dem in diesem Rahmen entstandenen methodisch beach- 
tenswerten experimentell-statistischen Arbeiten haben untersucht: 
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G. Griinewald die Schreib- und Sprechmotorik der Konstitutions- 
typen (1947a), E. Zuberbier die der Depressiven und A. Spitznagel 
die der Epileptiker. 

Einen ganz anders gerichteten Beitrag zu dem hier in Rede 
stehenden Themenkreis hat G. Heese in einer anregenden Arbeit 
iiber Akzente und Begleitbewegungen geliefert. Er geht dem Zu- 
sammenhang von Intonation und Dynamik und den Bekraftigungs- 
gebarden nach. Beide Ausdrucksmittel haben die gleiche Funktion. 
Sie sind auch in gleicher Weise von emotionalen Bedingungen ab- 
hangig. Bei Aussagen und Fragen haben die Bekraftigungsgebarden 
durchaus verschiedene Formen. 

Neben der sich anbahnenden gennematisch orientierten ver- 
gleichenden Ausdruckskunde bleibt das desideratum einer genetisch 
eingestellten, d.h. einer solchen, die den stimmlichen Ausdruck mit 
dem mimischen und mit anderen Ausdrucksarten hinsichtlich der 
im Ganzheitsverband wirksamen physiologischen Generatoren ver- 
gleicht. Sie wird an Duiker anzukniipfen haben. 
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Die phonetische und lautgeschichtliche 
Erforschung der finnisch-ugrischen Sprachen 


in den Jahren 1941-1955 * 
I. Teil 


Von Autis J. Joxi, HELSINKI 


1. Allgemein-Finnisch-Ugrisch 


Man kann sagen, daB die Grundziige der Geschichte der Kon- 
sonanten der finnisch-ugrischen und auch der uralischen (finnisch- 
ugrisch-samojedischen) Sprachen schon vor ungefahr vierzig Jahren 
als geklart angesehen werden konnten, obwohl manche Einzelheit 
immer noch ihrer Erklarung harrt. Friiher war man hinsichtlich der 
Entwicklung des Vokalismus der finnisch-ugrischen und samojedi- 
schen Sprachen noch mehr im dunkeln. In den letzten Jahren 
haben mehrere Forscher entschlossen die zentralen Probleme der 
vergleichenden finnisch-ugrischen Vokalgeschichte angegriffen. Be- 
sonders bedeutende Ergebnisse haben in dieser Hinsicht Wolfgang 
Stentz und Erkki Itkonen erzielt. Steinitz, dessen Spezialgebiet die 
obugrischen Sprachen sind, insbesondere das Ostjakische, hat die 
Hauptergebnisse seiner vergleichenden Vokaluntersuchungen im 
Jahre 1942 in knapper Thesenform ver6ffentlicht: «Geschichte des 
finnisch-ugrischen Vokalismus» (Thesen zu einem Vortrag im 
Ungarischen Institut, Stockholm, am 28. 9. 1942, 9 S., Ungarisches 
Institut, Universitat Stockholm; Maschinendruck). Zwei Jahre 
spater erschien unter dem gleichen Namen ein umfangreicheres 

* Da ein so langer Zeitraum behandelt wird, muBte man sich auf die Darstellung 
der wichtigsten Forschungsergebnisse beschranken. So wurden auch gewisse Werke 
weggelassen, wenn darin das Hauptaugenmerk z. B. auf morphologische oder wort- 
geschichtliche Fragen gerichtet war. 


Die verschiedenen ostseefinnischen Sprachen und das Ungarische werden im 
II. Teil von Antti Sovijaérvi behandelt werden. 
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Werk (in der Reihe Acta Instituti Hungarici Universitatis Hol- 
miensis, Series B, Linguistica 2, 144 S.), das ein wichtiger Schritt 
in der Erforschung der finnisch-ugrischen Lautgeschichte ist. Kurz 
gesagt gelangt Steinitz in bezug auf den Vokalismus in der ersten 
Silbe zu folgenden Resultaten. Er ist der Ansicht, daB das Ost- 
jakische (insbesondere die Dialekte an den Fliissen Wach und 
Wasjugan) sowie auch das Tscheremissische die Schliisselposition 
bei der Erforschung der Geschichte des Vokalismus der finnisch- 
ugrischen Sprachen bilden, und zwar deshalb, weil sich in diesen 
Sprachen deutlich zwei Hauptgruppen der Vokale, volle und re- 
duzierte Vokale, abheben. Steinitz versucht zu beweisen, daB die 
gleiche Doppelheit auch in den anderen finnisch-ugrischen Spra- 
chen (und im Samojedischen) bestanden hat, und seiner Meinung 
nach hat es in der finnisch-ugrischen Ursprache sicherlich die fol- 
genden Vokale gegeben: 


a 
volle 


tego le es 


i* 


Wc] > ®& A: 


reduzierte 0 0 


Neben diesen «regelmaBigen Vokalentsprechungen » hat es nach 
der Ansicht von Steznitz in der finnisch-ugrischen Ursprache etwa zehn 
paradigmatische (grammatische) Falle von Vokalwechsel gegeben: 

AW AW, AWOUIDU, IWMI, UDO, G1, Ge, Ew ée. 

Derselbe Forscher hat auch spater Fragen der finnisch-ugri- 
schen Vokalgeschichte behandelt, z. B. in dem Artikel «Vokal- 
systeme und Vokalgeschichte der finnisch-ugrischen Sprachen» 
(Z. f. Phon. I, S. 32-40, 1947) und in den umfangreichen Mono- 
graphien «Geschichte des ostjakischen Vokalismus» (Berlin 1950, 
138 S.) und «Geschichte des wogulischen Vokalismus (Finn.-ugr. 
Stud. II, Berlin 1955, IX + 366 S.). 

Die Vokaltheorie von Steinitz hat nicht die einmiitige Zu- 
stimmung von seiten der anderen Finnougristen erfahren. Erkki 
Itkonen, dessen im Jahre 1939 erschienene Dissertation «Der ost- 
lappische Vokalismus vom qualitativen Standpunkt aus» die erste 
Gesamtdarstellung der Geschichte des Vokalismus des Lappischen 
war, hat es sich zur Aufgabe gemacht, das erstgenannte Werk von 
Steinitz in seiner umfangreichen Abhandlung « Zur Frage nach der 
Entwicklung des Vokalismus der ersten Silbe in den finnisch-ugri- 


* Die Typen i und é bezeichnen hier die Vokale der mittleren Zungenlage. 
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schen Sprachen, insbesondere im Mordwinischen» (Finn.-ugr. 
Forsch. XXIX, S. 222-337, Helsinki 1946) griindlich zu unter- 
suchen. Itkonen geht von dem Standpunkt aus — der sich zweifellos 
als richtig erwiesen hat —-, daB bei der Erklaérung der finnisch- 
ugrischen Vokalgeschichte weder das Ostjahische noch das Tschere- 
missische die Schliisselposition innehat, sondern die ostseefinnischen 
Sprachen (einschlieBlich des Lappischen), die bekanntlich auch in 
manchen anderen Hinsichten uralte Ziige treu bewahrt haben. 
Seiner Meinung nach kann bewiesen werden, daf die im Finnischen 
(und auch schon im Urfinnischen) vorherrschenden Vokalkatego- 
rien, kurzer (kurzer Vollvokal) und entsprechender langer Vokal 
(0-0, u—wu, e—é, 1 — 7) schon in den vorurfinnischen Sprachformen 
offenbar bis zur finnisch-ugrischen Ursprache hin bestanden ha- 
ben*. (Steinitz seinerseits halt die ostseefinnischen langen Vokale 
fiir sekundar.) In bezug auf die angenommenen Vokalwechsel ver- 
tritt Itkonen die Ansicht, daB die Ablauterscheinung den finnisch- 
ugrischen Sprachen urspriinglich fremd ist und da die an die 
indogermanischen Ablaut- und Umlauterscheinungen erinnernden 
Ziige in den dem Finnischen verwandten Sprachen Ergebnisse 
einer spateren Sonderentwicklung sind, die sich in diesen Sprachen 
vollzogen hat. Itkonen stellt fest, daB die mechanische Untersuchungs- 
methode von Steinitz durch eine solche ersetzt werden muB, die das 
ganze Lautsystem der Sprachen beriicksichtigt und nicht den 
Vokalismus der ersten Silbe als eine aus dem Zusammenhang her- 
ausgeléste Sondererscheinung betrachtet. Ferner stellt er in seiner 
genannten Untersuchung (S. 289-336) ausfiihrlich die Entwick- 
lungsgeschichte des Vokalismus des Mordwinischen dar. Zu dem 
spaturmordwinischen einfachen Vokalsystem gehorten nur 6 kurze 
Vokale: 3 hintere und 3 vordere. 

Spater hat Jtkonen in zahlreichen Abhandlungen seine Vokal- 
theorie weiterentwickelt. Im Jahre 1948 erschien der Artikel 
«Vokaalikombinaatiot ja vartalotyypit» (Vokalkombinationen 
und Stammtypen, Virittaja 1948, S. 124-144, mit deutschem Re- 
ferat, S. 200-201). Die Wéorter der finnisch-ugrischen Sprachen 
sind (die einsilbigen Pronomina ausgenommen) von Anfang an 
zweisilbig gewesen, und sie haben als SchluBvokal des Stammes 
a, @ oder e gehabt. Diese Stammtypen und die darin vorkommenden 

* Spater hat A. 7. Joki auch in dem Samojedischen Lauterscheinungen festgestellt, 


die zeigen, daB eine 4hnliche Gruppeneinteilung wahrscheinlich schon in der uralischen 
Ursprache bestanden hat. (Virittaja 1950, S. 157-158.) 
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Vokalkombinationen betrachtet Jtkonen in seinem Artikel, indem er 
z. B. die erwahnten Typen im Finnischen und Lappischen in Grup- 
pen einteilt und statistisch untersucht. Es stellt sich heraus, daB von 
den Altesten Wortern der finnisch-ugrischen Sprachen (also von 
solchen, fiir die eine Entsprechung in der ugrischen Gruppe oder 
sogar im Samojedischen nachzuweisen ist) iiber die Halfte e-Stam- 
me sind. Im Gegensatz dazu bilden in der jiingeren finnisch-per- 
mischen Wortschicht die a-Stamme die Mehrzahl. In der ersten 
Silbe der altesten a-Stimme kommt kein e-Vokal vor, die Vokal- 
kombination e-—a trifft man erst in den Wortern der finnisch- 
permischen Periode an. In der finnisch-ugrischen Ursprache (und 
auch in dem davorliegenden Ururalischen) gab es keinen mittleren 


Vokal é (wie auch kein 7) und auch kein 6. In der ersten Silbe _ 


kamen die Vokalpaare a —d, 0 —e, u— ii sowie paarloses 7 vor, in der 
zweiten Silbe hingegen das Vokalpaar a — d und paarloses e. Hierbei 
wurden die hinteren Vokale der ersten Silbe mit dem a der zweiten 
Silbe kombiniert und die vorderen Vokale mit dem d, das paarlose z 
jedoch konnte sowohl mit dem a als auch mit d kombiniert werden. 
Alle Vokale der ersten Silbe konnten mit dem paarlosen e der zweiten 
Silbe kombiniert werden. Durch diese Kombinationserscheinung 
erklart sich nach Itkonen die Entstehung der finnisch-ugrischen 
Vokalharmonie, einer Lauterscheinung, iiber deren uralte finnisch- 
ugrische, ja schon uralische Herkunft Byérn Collinder die Abhandlung 
«Das Alter der Vokalharmonie in den uralischen Sprachen» 
(Sprakvetenskapliga Sallskapets i Uppsala Forhandl. 1940-1942, 
Uppsala 1942, S. 85-114) verdffentlicht hat. — Erkki Itkonens 
folgende Untersuchung, deren Hauptgewicht gleichfalls auf dem 
Gebiet der Vokalgeschichte liegt, «Beitrage zur Geschichte der 
einsilbigen Wortstamme im Finnischen» (Finn.-ugr. Forsch. XXX, 
S. 1-54, Helsinki 1949), behandelt trotz ihrem Namen auch andere 
finnisch-ugrische Sprachen. Im Ostseefinnischen gibt es eine ganze 
Reihe einsilbige, langvokalische (oder diphthongische) Nomen 
und Verben, deren Vokalismus in dieser Abhandlung entwickelt 
und bis ins einzelne erklart worden ist. In dem Werk «Zur 
Geschichte des Vokalismus der ersten Silbe im Tscheremissischen 
und in den permischen Sprachen» (Finn.-ugr. Forsch. XXXI, 
S. 149-345, Helsinki 1954) besteht Itkonens Untersuchungsmaterial 
aus 442 tscheremissisch-permischen Wortvergleichungen, wobei 
auferdem etwa 2000 gemeintscheremissische und gemeinpermische 
Stammworter mitberiicksichtigt worden sind. Anhand dieses um- 
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fangreichen Materials hat der Autor z. B. auch wichtige laut- 
statistische Untersuchungen durchfiithren kénnen. Dabei gelangt 
der Verfasser zu der urtscheremissischen und urpermischen Vokal- 
reihe der ersten Silbe a, 0 — 0, u — a, a, e —@, ti, 1-7. Diese vortschere- 
missisch-vorpermische Vokalreihe entspricht dem von Jtkonen in 
friiheren Untersuchungen dargestellten friihurfinnischen, vorlappi- 
schen und vormordwinischen Vokalismus der ersten Silbe, auf den 
auch der vorugrische Vokalismus zuriickzufiihren ist, so daB die 
erwahnte Vokalreihe offenbar auch die Lautverhaltnisse der fin- 
nisch-ugrischen Ursprache widerspiegelt. Als Beispiel fiir die von 
dem Verfasser durchgefiihrte miihevolle ascensive Analyse sei er- 
wahnt, daB das # des modernen Tscheremissischen seiner Meinung 
nach sogar neun vortscheremissische Vokale vertreten kann: e, 2, 0, 
da, 0, a, ti, Z und i. Das umfangreiche, die mittleren Vokale é und 7 
der permischen Sprachen betreffende Kapitel ist in vieler Hinsicht 
interessant und beschreitet neue Wege. Dasselbe kann von der 
gesamten Untersuchung gesagt werden, in der stets der Ganzheit 
des Systems der Sprachen besondere Aufmerksamkeit gewidmet 
wird und wo u. a. der Einflu8 der Nachbarkonsonanten auf die 
Vokale wie auch die Rolle der Vokale der zweiten Silbe in der Ent- 
wicklung des Vokalismus der ersten Silbe betrachtet wird, etwas, 
worauf Itkonen auch in seinen friiheren Untersuchungen sein Augen- 
merk gerichtet hatte. — Ein wichtiges und zentrales Thema be- 
handelt Jtkonens Schrift «Uber die Betonungsverhiltnisse in den 
finnisch-ugrischen Sprachen» (Acta Ling. Acad. Scient. Hung. V, 
S. 21-34, Budapest 1955). Der heute in vielen finnisch-ugrischen 
Sprachen vorkommende freie Akzent ist offenbar das Ergebnis 
einer viel spateren Sonderentwicklung. Urspriinglich lag der 
Hauptakzent sicherlich auf der ersten Silbe, wie es z.Z. auch im 
Ostseefinnischen, im Lappischen, in den meisten wogulischen Dia- 
lekten und im Ungarischen der Fall ist. 

Von den die Geschichte des Konsonantismus der finnisch- 
ugrischen und uralischen Sprachen betreffenden Untersuchungen 
sei zunachst erwahnt die knappe Gesamtdarstellung von Steinitz 
«Geschichte des finnisch-ugrischen Konsonantismus» (Acta Inst. 
Hung. Univ. Holmiensis, Series B. Linguistica I, S. 15-39, Stock- 
holm 1952; die Untersuchung war schon 1945 fertig). Sie enthalt 
eine ganze Reihe beachtenswerter Beobachtungen sowie Polemik 
gegen andere Forscher. «Mit allem Vorbehalt» gelangt Steinitz zu 
folgendem finnisch-ugrischen Konsonantensystem: 
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stimmlose Klusile pees teak 
stimmhafte Spiranten £6 A** 6’ y 
stimmlose Spiranten Sia eesist 


Hierzu kommen noch die Nasale y, n, n, n’ und m sowie die 
Liquida /, I, /' und r wie auch der Halbvokal 7. Steinitz nimmt also 
an, daB es in der finnisch-ugrischen Ursprache eine ganze Reihe von 
Kakuminalkonsonanten gegeben hat: t (oder é), 8, 4, n, Ll, wie sie 
heute nur in einigen ostjakischen Dialekten festzustellen sind. 
Offenbar ist es jedoch so, daB die kakuminalen (oder richtiger 
postalveolaren) Konsonanten des Ostjakischen spater entstanden 
sind, mit Ausnahme der Affrikata £3, die deutlich finnisch-ugrisch, 
ja sogar uralisch ist. Einerseits nimmt Steinitz also an, da das 
Konsonantensystem der Ursprache (nur auf Grund des Ostjaki- 
schen!) reicher gewesen sein soll, als es offenbar der Fall gewesen 
ist, aber andererseits verwirft er die von alters her anerkannte Auf- 
fassung, wonach es in der Ursprache eine Reihe von Geminat- 
klusilen: kk, tt, pp im Wortinneren gegeben hatte, die deutlich im 
Ostseefinnischen und im Lappischen erhalten sind. Dieses ableh- 
nende Urteil der langen Quantitatsreihe steht in Verbindung mit 
der Auffassung von Steinitz, daB die seinerzeit von Setdld geschaffene 
finnisch-ugrische und uralische Stufenwechseltheorie als irrefithrend 
vollig zu verwerfen wire. 

Das R&tsel des Stufenwechsels ist in der letzten Zeit auch von 
vielen anderen Finnougristen beriihrt worden. Von den Schriften 
auf diesem Gebiet seien u. a. erwahnt Byrn Collinders «Az urdli 
fokvalta kozds» (Nyelvtudomanyi kézlemények LII, S. 15-30, Bu- 
dapest 1944-1948), A. Rauns «Sur la théorie des alternances con- 
sonantiques et vocaliques, surtout en finno-ougrienne» (Acta 
Ling. V, S. 38-41, Kobenhavn 1945-1949), von demselben Forscher 
«Sananen aannevaihtelusta» (Etwas iiber den Lautwechsel) (mit 
franz. Referat: Des variations des sons, Virittaja 1948, S. 278-279, 
Helsinki 1948), V. Taulis «Astmevahelduse tekkimise foneetilised 
tingimused» (Phonetic Conditions of the Origin of Alternation), 
Virittaja 1947, S. 174-181, Lauri Kettunens «Astevaihtelun salaisuus» 
(Das Geheimnis des Stufenwechséls), Virittaja 1949, S. 69-75, und 
Paavo Ravilas «Astevaihtelun arvoitus» (The problem of the gra- 
dation), Virittaja 1951, S. 292-300. Collinder vertritt die Auffassung— 


* Halbfette Typen zeigen hier kakuminale Formen an. 
** Da aus drucktechnischen Griinden 6 nicht als halbfette Type wiedergegeben 
werden kann, soll 4 die kakuminale Form bezeichnen. 
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wie auch Setdld, der Darsteller dieser Theorie —, daB die Wurzeln 
des Stufenwechsels bis in die Zeit der uralischen Ursprache hinein- 
reichen. Tauli untersucht in seinem Artikel, welche Hilfe die Pho- 
netik bei dem Problem des Stufenwechsels bietet. Raun bemerkt, 
daB der Lautwechsel (sowohl der Vokale als auch der Konsonanten) 
eine typisch synchronische Erscheinung ist, die keine Geschichte 
haben kann, so daB die Annahmen hinsichtlich der uralten Laut- 
wechsel unsicher bleiben. Kettunen hat sich immer skeptisch gegen- 
iiber den verschiedenen Fragen des Stufenwechsels verhalten, die 
er jedoch im allgemeinen nur von seinem eigenen ostseefinnischen 
Blickwinkel her betrachtet hat. Die von Y. H. Toivonen in der Un- 
tersuchung «Zum Problem des Protolappischen» (Sitzungsberichte 
der Finnischen Akademie der Wissenschaften 1949, S. 161-189, 
Helsinki 1950) vorsichtig dargelegte Hypothese, da8 der Stufen- 
wechsel méglicherweise aus einer vorlappischen Sprachform, aus dem 
sogenannten Protolappischen ins Vorfinnische entlehnt worden sei, 
gab wahrscheinlich dem alles unter einer weiten Perspektive be- 
trachtenden Ravila die Anregung zu der obengenannten Schrift. 
Ravila lehnt diese Entlehnungshypothese kategorisch ab und ver- 
weist darauf, daB der Stufenwechsel im Lappischen eher als eine 
Entlehnung erklart werden kann. Ravila halt den Stufenwechsel 
keinesfalls fiir eine uralte Erscheinung, die aus der finnisch- 
ugrischen oder uralischen Ursprache stammt, sondern er nimmt an, 
daB dieser ausschlieBlich auf das Urfinnische zuriickgeht. Seine 
Theorie ist folgende: «Die vorfinnischen Geminatenklusile kk, tt, 
pp sind im Urfinnischen in allen Positionen auBer an der Grenze zwi- 
schen einer betonten und unbetonten Silbe vor einer offenen Silbe 
abgeschwicht. In allen den Positionen, wo die Geminatenklusile ab- 
geschwacht sind, sind auch die einzeln vorkommenden Tenuisklusile 
abgeschwacht. Die letztgenannten sind in allen den Positionen 
unabgeschwiacht erhalten geblieben, wo auch der Geminatenklusil 
erhalten ist, sowie auch in allen den Positionen, wo kein Geminaten- 
klusil vorgekommen ist.» — Es sei schon hier erwahnt, daB8 auch 
Lauri Posti in seiner beachtenswerten Untersuchung «From Pre- 
Finnic to Late Proto-Finnic» (woriiber spater mehr auf S.159) den 
Standpunkt vertritt, daB der ostseefinnische Stufenwechsel nur auf 
das Urfinnische zuriickzufiihren sei, wo er durch den damals be- 
sonders starken germanischen EinfluB entstanden ware. Doch ist zu 
sagen — wie u. a. Erkki Itkonen bemerkt hat (Virittaja 1953, S. 308) -, 
daB die Entstehung des ostseefinnisch-lappischen Stufenwechsels 
auch heute noch nicht fiir endgiiltig gelést angesehen werden kann, 
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sondern es mu auch weiterhin die sehr 4hnliche Konsonanten- 
wechselerscheinung, die im Samojedischen am anderen Ende der 
uralischen Sprachgemeinschaft vorkommt, beriicksichtigt werden. 

Trotz ihrem gedrangt erscheinenden Titel befaBt sich die zwei- 
hundert Seiten umfassende Untersuchung von Elemér Moér «Die 
Ausbildung des ungarischen Konsonantismus» I-II (Acta Ling. 
Acad. Scient. Hung. II, S. 1-96, 355-463, Budapest 1952/53) ein- 
gehend mit den verschiedenen Gebieten der Geschichte des Kon- 
sonantismus in einzelnen finnisch-ugrischen Sprachen, und der Aus- 
gangspunkt des Verfassers ist immer die finnisch-ugrische Ur- 
sprache. Moér nimmt von vornherein eine negative Stellung in 
bezug auf den uralischen Stufenwechsel ein. Die Untersuchung des 
Konsonantismus beginnt er mit den Affrikaten im Wortinneren, von 
denen er annimmt, daf es davon drei in der Ursprache gegeben hat, 
namlich é, c’ und ¢ (gewéhnlich nimmt man an, daB es nur zwei 
finnisch-ugrische und uralische Affrikaten gegeben hat, kakumi- 
nales *¢ und mouilliertes *c’ oder *¢’). Nachdem er einen Blick auf 
die Tenues der verschiedenen finnisch-ugrischen Sprachen ge- 
worfen hat, betrachtet der Verfasser die Geschichte der Sibilanten, 
die in der ugrischen Gruppe bekanntlich von der der anderen 
Sprachen abweicht, z. B. in der Hinsicht, daB *s und *§ der Ur- 
sprache im Ungarischen vollig verschwunden sind; Moér nimmt an, 
daB dem vélligen Schwund ein fh vorausgegangen ist, was auch 
méglich ist. Abzulehnen hingegen ist die Auffassung des Verfassers, 
daf es in der finnisch-ugrischen Ursprache auch ein anlautendes *7 
gegeben hat. Ganz unbegriindet behauptet er weiterhin, daB es in 
der Ursprache keine Dentalspiranten *6 und *6’ gegeben hatte, 
sondern an deren Stelle die Klusile *d und *d’. Nicht stichhaltige 
Theorien legt Moér auch in dem Kapitel seiner Schrift «Die per- 
mische Grundschicht des Ungarischen» dar, z. B. wenn er zu be- 
weisen versucht, daB stimmhaftes b, d, g und z, die anlautend 
sekundar sowohl im permischen Zweige als auch im Ungarischen 
anzutreffen sind, bereits in der Ursprache im Anlaut aufgetreten 
sind, obwohl es klar ist, daB sie von vornherein nur zu den Posi- 
tionen im Wortinneren gehort. haben. 

In den uralischen Sprachen hat es anfanglich keine Konsonan- 
tengruppen im Wortanfang gegeben. (Dentalaffrikaten, die in dieser 
Position wahrscheinlich doch vorkamen, miissen als Einzellaute er- 
klart werden.) Im Wortinneren dagegen hat es Konsonantenverbin- 
dungen verschiedener Art gegeben, in deren Geschichte es noch viele 
ungeklarte Punkte gibt. In seiner Schrift «On the Question of Con- 
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sonant Combinations in Finno-Ugrian» (Commentationes Fenno- 
Ugricae in honorem Y. H. Toivonen, Mémoires de la Société Finno- 
ougrienne XCVIII, S. 165-188, Helsinki 1950) betrachtet Asdjérn 
Nesheim diese inlautenden Konsonantengruppen, insbesondere die, 
welche man im Lappischen antrifft, und von diesen hauptsachlich 
solche, die als Nachkomponente ein g (finnisches k) haben. 

Von anderen bedeutenden Werken, deren Hauptgewicht auf 
einem anderen Gebiet als auf dem der Lautgeschichte liegt, in 
denen aber dennoch auch Fragen der Lautgeschichte beriihrt wer- 
den, seien die wichtigen etymologischen Worterbiicher Bjérn Col- 
linders «Fenno-Ugric Vocabulary. An Etymological Dictionary of 
the Uralic Languages» (XXII + 212 S., Uppsala 1955) und Y H. 
Toivonens «Suomen kielen etymologinen sanakirja I» (Etymologi- 
sches Worterbuch der finnischen Sprache I, Lexica Societatis 
Fenno-ugricae XII, 1, XXVI + 204 S., Helsinki 1955) erwahnt. 


2. Vor- und Urfinnisch, Allgemein-Ostseefinnisch 


Von den in der zu behandelnden Periode erschienenen Unter- 
suchungen der fritheren Lautgeschichte der ostseefinn. Sprachen 
ist Laurt Postis «From Pre-Finnic to Late Proto-Finnic. Studies on 
the Development of the Consonant System» (Finnisch-ugrische 
Forschungen XX XI, S. 1-91, Helsinki 1953), die oben bereits kurz 
erwahnt wurde, die bedeutendste. Dort werden die qualitativen 
Veranderungen des Konsonantismus betrachtet, die sich in der ver- 
haltnismaBig kurzen Zeitspanne vor etwa zweitausend Jahren voll- 
zogen haben, als das Friihurfinnische in das Spaturfinnische tiber- 
ging. Nach Postt gab es 16 Gruppen von Veranderungen. In jener 
Periode verschwand u.a. die Mouillierung der Konsonanten (so z.B. 
5’ >s,n' >n, 6’ >, t's’ > ts), m>n (im absoluten Auslaut), §> h, 
-kt- > -ht-, t > s (vorz), In > ll usw. Posti erklart, daB Umwalzungen 
dieser Art im Lautsystem des Urfinnischen auf den damals so starken 
fremden EinfluB, auf baltische und besonders germanische Super- 
strate zuriickzufiihren sind, eine Theorie, die auch durch die be- 
sonders zahlreichen in der urfinnischen Periode ttbernommenen 
baltischen und germanischen Lehnworter unterstiitzt wird. 

Von den Schriften, die die Geschichte des allgemein-ostsee- 
finnischen Konsonantismus behandeln, sei ferner Y. H. Totvonens 
«Zur Hypothese tiber einen Lautwandel h < *j in den ostsee- 
finnischen Sprachen» (Ural-Altaische Jahrbiicher XXIV, Heft 3-4, 
S. 42-50, 1952) genannt. Dort wird die von vielen Forschern ver- 
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tretene Auffassung itiber den obengenannten Lautwandel endgiiltig 
widerlegt, und zugleich wird auch festgestellt, daB das finnisch- 
ugrische *7 in den ostseefinnischen Sprachen vor allen anderen 
Vokalen erhalten geblieben ist auBer vor e und 7. 

Vokalfragen des Urfinnischen werden (auBer in den oben- 
erwahnten Untersuchungen von Steinitz und Itkonen) auch in einigen 
kiirzeren, aber wichtigen Schriften behandelt, u. a. in Erkki Itkonens 
Artikel «Varhaiskantasuomen paadpainottoman ai-diftongin kahta- 
laisen kehityksen syista» (Uber die Ursachen der doppelten Ent- 
wicklung des friihurfinnischen nicht hauptbetonten ai-Diphthongs, 
Virittaja 1942, S. 117-125, Helsinki). In den ostseefinnischen Spra- 
chen haben sich die nicht hauptbetonten Diphthonge di und ¢ zu i 
oder i entwickelt, und aus ai ist entweder z (2) oder oi geworden; im 
letzteren Falle hat man gewohnlich als Zwischenstufe ein mittel- 
vokalisches é angenommen. Der Verfasser erklart ausfiihrlich die 
phonetischen Ursachen, die zu dieser Doppelheit gefiihrt haben. 
(Von der Schrift befindet sich an derselben Stelle, S. 205-206, 
ein deutsches Referat.) — In der Schrift desselben Verfassers 
«Onko kantasuomessa ollut keskivokaaleja?» (Hat es im Ur- 
finnischen mittlere Vokale gegeben?, Virittaja 1945, S. 158-182) 
wird die Frage, die im vorangehenden angeschnitten wurde, naim- 
lich die Existenz der mittleren Vokale é und iim Urfinnischen, einer 
genauen Erérterung unterzogen, und das Problem wird auch aus 
einem weiteren finnisch-ugrischen Gesichtswinkel betrachtet. 
Itkonen zeigt, daB die Argumente, die die von Setald angefihrte 
Theorie der mittleren Vokale unterstiitzt haben, nicht stichhaltig 
sind, und er gelangt zu der Auffassung, daB der mittlere Vokal é 
(das 6 des Schriftestnischen), den man heute in den siidlichen ost- 
seefinnischen Sprachen (im Wotischen, Estnischen und Livischen) 
antrifft, erst nach Abschlu8 der gemeinsamen urfinnischen Periode 
aus dem etwas velarisierten vorderen Vokal e entstanden ist. (Ein 
ausfiihrliches deutsches Referat uber die Abhandlung befindet sich 
auf den Seiten 298-299.) Vgl. auch die Polemik Lauri Kettunens 
« Eik6é kantasuomessa ollut keskikielen vokaaleja?» (Gab es im Ur- 
finnischen keine Vokale der mittleren Reihe?), Virittaja 1948, 
S. 120-124, - Zu erwahnen ist ferner Erkki Itkonens Abhandlung 
«Uber die suffixalen Labialvokale im Lappischen und Ostsee- 
finnischen» (Festschrift Collinder, Scandinavica et fennougrica, 
S. 183-191, Stockholm 1953/54), aber Naheres dariiber in dem 
Abschnitt tiber die lappische Sprache. 
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